Բոլոր տեսակի անորոշությունները NLP-ում


Քանի որ բնական լեզուն երբեմն կարող է բաց լինել բազմաթիվ մեկնաբանությունների համար, այն կփոխանցվի համակարգիչներին, ովքեր կփորձեն հասկանալ իրենց տրված բնական լեզվի մուտքագրումը: Հաճախ նախադասությունը լիովին հասկանալը կարող է դժվար լինել, երբ մեզ բավարար ենթատեքստ չի տրվում կամ վատ քերականություն կա:

Այս հոդվածում մենք կքննարկենք բազմաթիվ տարբեր տեսակի անորոշություններ, որոնք հայտնաբերված են NLP-ում:

Խոսքի մաս (POS) պիտակավորման երկիմաստություն

POS հատկորոշումը վերաբերում է տեքստի բառերը խոսքի մի մասին դասակարգելու գործընթացին. արդյոք բառը բայ է, գոյական և այլն: Հաճախ դուք նկատում եք, որ նույն բառը կարող է մի քանի դասակարգում ստանալ խոսքի իր մասի համար՝ կախված նրանից: ինչպես է կառուցված նախադասությունը. Օրինակ, բավականին տարածված է տեսնել բառեր, որոնք կարող են օգտագործվել և՛ որպես բայ, և՛ որպես գոյական −

  • Ես պետք է ուղարկեմ ընկերոջս ֆայլերը: (Բայ)

  • Ես պետք է գտնեմ ինձ ուղարկված փոստը : (Գոյական)

Կառուցվածքային երկիմաստություն

Այս երկիմաստությունն առաջանում է, քանի որ նույն ճշգրիտ նախադասությունը կարող է տարբեր կերպ մեկնաբանվել՝ հիմնվելով նախադասության վերլուծության վրա: Վերցրեք հետևյալ նախադասությունը −

The boy kicked the ball in his jeans. 

Այս նախադասությունը կարելի է մեկնաբանել այնպես, որ տղան կամ ոտքով հարվածում է գնդակին ջինսե տաբատով, կամ հարվածում է գնդակին, երբ գնդակը ջինսե տաբատի մեջ էր: Սա կախված է նրանից, թե ինչպես է վերլուծվում նախադասությունը:

Շրջանակի երկիմաստություն

Այստեղ մենք նայում ենք անորոշություններին, որոնք առաջանում են քանակական սարքերի պատճառով: Հետադարձ հայացք գցելով մաթեմատիկական տրամաբանության որոշ տերմինաբանության կամ պարզապես հիմնական քերականության վրա՝ մենք գիտենք, որ «ամեն» և «ցանկացած» բառերը կհայտնվեն մտքում:

Վերցրեք հետևյալ նախադասությունը −

All students learn a programming language.

Այս նախադասությունը, շնորհիվ «բոլորը», որին հաջորդում է «ա» քանակական ցուցանիշների հաջորդական օգտագործմամբ ստեղծված շրջանակը, կարող է ունենալ երկու տարբեր իմաստ: Երկու իմաստներն են, որ −

  • Առաջինն այն է, որ բոլոր ուսանողները սովորում են նույն ծրագրավորման լեզուն:

  • Նրանք բոլորը սովորում են մի լեզու, որը պարտադիր չէ, որ նույն լեզուն լինի:

Լեքսիկական երկիմաստություն

Որոշ բառեր ունեն այն հատկությունը, որ կարող են ունենալ բազմաթիվ տարբեր իմաստներ: Գոյություն ունի բառապաշարային երկիմաստության երկու ձև՝ բազմիմաստություն և համանունություն:

Բազմիմաստություն – Սա այն դեպքում, երբ երկու բառերը նույնն են, բայց տարբեր նշանակություն ունեն՝ կախված գործածությունից, այսինքն՝ Foot բառը: Ոտքը կարող է նկարագրել մարմնի մասը կամ շենքի ոտքը: Ըստ էության, դուք ինչ-որ բանի հիմքը նկարագրում եք ոտք բառով։

Հոմանիշ – Սա տեղի է ունենում, երբ բառն ունի նույն ուղղագրությունը կամ արտասանությունը, բայց ընդհանուր առմամբ տարբեր իմաստներ ունի: Մինչդեռ մակերեսորեն նույնը, դրանք իմաստով լրիվ տարբեր են։ Բաս բառը, օրինակ, կարող է վերաբերել երաժշտական գործիքին կամ ձկան տեսակին: Մեկ այլ օրինակ, որը բերված է այստեղ՝ պարզաբանելու համար, որ կարևոր է ոչ միայն ուղղագրությունը, այլև արտասանությունը, ձիու և խռպոտ է: Այս երկուսն ունեն նման արտասանություններ, բայց ձին վերաբերում է կենդանուն, իսկ խռպոտը վերաբերում է կոկորդի ցավին:

Իմաստային երկիմաստություն

Այժմ, բազմակի իմաստ ունեցող բառի փոխարեն, նախադասությունները կարող են ունենալ բազմաթիվ իմաստներ՝ կախված համատեքստից: Օրինակ, «Նա կերավ այրված լազանյա և կարկանդակ» նախադասությունը կարող է նշանակել երկու բաներից մեկը.

  • Որ լազանիան այրվել է, իսկ կարկանդակը՝ ոչ։

  • Որ երկուսն էլ այրվել են։

Լեքսիկական երկիմաստությունը կարելի է համարել իմաստային երկիմաստության ենթատեսակ:

Հղման երկիմաստություն

Հղման երկիմաստությունը առաջանում է, երբ արտահայտությունը կարող է ունենալ բազմաթիվ մեկնաբանություններ՝ բազմաթիվ օբյեկտների օգտագործման և հղումների անորոշ լինելու պատճառով: Օրինակ վերցրեք − նախադասությունը

I looked at Michelle with the telescope.

Սա կարող է նշանակել երկու բան՝ կախված նրանից, թե ով ունի աստղադիտակը:

  • Աստղադիտակը կրում էր հենց ինքը՝ Միշելը։

  • Նախադասությունն ասողն աստղադիտակ էր օգտագործում Միշելին տեսնելու համար:

Անաֆորիկ երկիմաստություն

Այստեղ մենք ունենք աննշանորեն նման երկիմաստություն ռեֆերենցիոն երկիմաստության, բայց ավելի շատ ամրագրված դերանունների վրա: Դերանունների օգտագործումը կարող է որոշակի շփոթություն առաջացնել, եթե նախադասության մեջ հիշատակվում են բազմաթիվ մարդիկ: Վերցրեք հետևյալ նախադասությունը −

Michelle told Romany that she ate the cake.

Այժմ, միայն նախադասությունից պարզ չէ, թե «նա» նկատի ունի Միշելին, թե Ռոմանին:

Եզրակացություն

Այստեղ մենք խորապես նայեցինք լեզվաբանությանը և մասնավորապես երկիմաստություններին: Հաշվի առնելով, որ Natural Language Processing-ը վերաբերում է բնական լեզվին (հատկապես անգլերենը մեծ մասամբ), մենք այս դասում կատարելագործեցինք լեզվաբանության մեր հմտությունները, և դա կօգնի մշակել տարբեր բնական լեզուների մուտքագրումը և ստեղծել ալգորիթմներ՝ հասկանալու, թե ինչ է ասվում: