Բոլոր տեսակի անորոշությունները NLP-ում
Քանի որ բնական լեզուն երբեմն կարող է բաց լինել բազմաթիվ մեկնաբանությունների համար, այն կփոխանցվի համակարգիչներին, ովքեր կփորձեն հասկանալ իրենց տրված բնական լեզվի մուտքագրումը: Հաճախ նախադասությունը լիովին հասկանալը կարող է դժվար լինել, երբ մեզ բավարար ենթատեքստ չի տրվում կամ վատ քերականություն կա:
Այս հոդվածում մենք կքննարկենք բազմաթիվ տարբեր տեսակի անորոշություններ, որոնք հայտնաբերված են NLP-ում:
Խոսքի մաս (POS) պիտակավորման երկիմաստություն
POS հատկորոշումը վերաբերում է տեքստի բառերը խոսքի մի մասին դասակարգելու գործընթացին. արդյոք բառը բայ է, գոյական և այլն: Հաճախ դուք նկատում եք, որ նույն բառը կարող է մի քանի դասակարգում ստանալ խոսքի իր մասի համար՝ կախված նրանից: ինչպես է կառուցված նախադասությունը. Օրինակ, բավականին տարածված է տեսնել բառեր, որոնք կարող են օգտագործվել և՛ որպես բայ, և՛ որպես գոյական −
Ես պետք է ուղարկեմ ընկերոջս ֆայլերը: (Բայ)
Ես պետք է գտնեմ ինձ ուղարկված փոստը : (Գոյական)
Կառուցվածքային երկիմաստություն
Այս երկիմաստությունն առաջանում է, քանի որ նույն ճշգրիտ նախադասությունը կարող է տարբեր կերպ մեկնաբանվել՝ հիմնվելով նախադասության վերլուծության վրա: Վերցրեք հետևյալ նախադասությունը −
The boy kicked the ball in his jeans.
Այս նախադասությունը կարելի է մեկնաբանել այնպես, որ տղան կամ ոտքով հարվածում է գնդակին ջինսե տաբատով, կամ հարվածում է գնդակին, երբ գնդակը ջինսե տաբատի մեջ էր: Սա կախված է նրանից, թե ինչպես է վերլուծվում նախադասությունը:
Շրջանակի երկիմաստություն
Այստեղ մենք նայում ենք անորոշություններին, որոնք առաջանում են քանակական սարքերի պատճառով: Հետադարձ հայացք գցելով մաթեմատիկական տրամաբանության որոշ տերմինաբանության կամ պարզապես հիմնական քերականության վրա՝ մենք գիտենք, որ «ամեն» և «ցանկացած» բառերը կհայտնվեն մտքում:
Վերցրեք հետևյալ նախադասությունը −
All students learn a programming language.
Այս նախադասությունը, շնորհիվ «բոլորը», որին հաջորդում է «ա» քանակական ցուցանիշների հաջորդական օգտագործմամբ ստեղծված շրջանակը, կարող է ունենալ երկու տարբեր իմաստ: Երկու իմաստներն են, որ −
Առաջինն այն է, որ բոլոր ուսանողները սովորում են նույն ծրագրավորման լեզուն:
Նրանք բոլորը սովորում են մի լեզու, որը պարտադիր չէ, որ նույն լեզուն լինի:
Լեքսիկական երկիմաստություն
Որոշ բառեր ունեն այն հատկությունը, որ կարող են ունենալ բազմաթիվ տարբեր իմաստներ: Գոյություն ունի բառապաշարային երկիմաստության երկու ձև՝ բազմիմաստություն և համանունություն:
Բազմիմաստություն – Սա այն դեպքում, երբ երկու բառերը նույնն են, բայց տարբեր նշանակություն ունեն՝ կախված գործածությունից, այսինքն՝ Foot բառը: Ոտքը կարող է նկարագրել մարմնի մասը կամ շենքի ոտքը: Ըստ էության, դուք ինչ-որ բանի հիմքը նկարագրում եք ոտք բառով։
Հոմանիշ – Սա տեղի է ունենում, երբ բառն ունի նույն ուղղագրությունը կամ արտասանությունը, բայց ընդհանուր առմամբ տարբեր իմաստներ ունի: Մինչդեռ մակերեսորեն նույնը, դրանք իմաստով լրիվ տարբեր են։ Բաս բառը, օրինակ, կարող է վերաբերել երաժշտական գործիքին կամ ձկան տեսակին: Մեկ այլ օրինակ, որը բերված է այստեղ՝ պարզաբանելու համար, որ կարևոր է ոչ միայն ուղղագրությունը, այլև արտասանությունը, ձիու և խռպոտ է: Այս երկուսն ունեն նման արտասանություններ, բայց ձին վերաբերում է կենդանուն, իսկ խռպոտը վերաբերում է կոկորդի ցավին:
Իմաստային երկիմաստություն
Այժմ, բազմակի իմաստ ունեցող բառի փոխարեն, նախադասությունները կարող են ունենալ բազմաթիվ իմաստներ՝ կախված համատեքստից: Օրինակ, «Նա կերավ այրված լազանյա և կարկանդակ» նախադասությունը կարող է նշանակել երկու բաներից մեկը.
Որ լազանիան այրվել է, իսկ կարկանդակը՝ ոչ։
Որ երկուսն էլ այրվել են։
Լեքսիկական երկիմաստությունը կարելի է համարել իմաստային երկիմաստության ենթատեսակ:
Հղման երկիմաստություն
Հղման երկիմաստությունը առաջանում է, երբ արտահայտությունը կարող է ունենալ բազմաթիվ մեկնաբանություններ՝ բազմաթիվ օբյեկտների օգտագործման և հղումների անորոշ լինելու պատճառով: Օրինակ վերցրեք − նախադասությունը
I looked at Michelle with the telescope.
Սա կարող է նշանակել երկու բան՝ կախված նրանից, թե ով ունի աստղադիտակը:
Աստղադիտակը կրում էր հենց ինքը՝ Միշելը։
Նախադասությունն ասողն աստղադիտակ էր օգտագործում Միշելին տեսնելու համար:
Անաֆորիկ երկիմաստություն
Այստեղ մենք ունենք աննշանորեն նման երկիմաստություն ռեֆերենցիոն երկիմաստության, բայց ավելի շատ ամրագրված դերանունների վրա: Դերանունների օգտագործումը կարող է որոշակի շփոթություն առաջացնել, եթե նախադասության մեջ հիշատակվում են բազմաթիվ մարդիկ: Վերցրեք հետևյալ նախադասությունը −
Michelle told Romany that she ate the cake.
Այժմ, միայն նախադասությունից պարզ չէ, թե «նա» նկատի ունի Միշելին, թե Ռոմանին:
Եզրակացություն
Այստեղ մենք խորապես նայեցինք լեզվաբանությանը և մասնավորապես երկիմաստություններին: Հաշվի առնելով, որ Natural Language Processing-ը վերաբերում է բնական լեզվին (հատկապես անգլերենը մեծ մասամբ), մենք այս դասում կատարելագործեցինք լեզվաբանության մեր հմտությունները, և դա կօգնի մշակել տարբեր բնական լեզուների մուտքագրումը և ստեղծել ալգորիթմներ՝ հասկանալու, թե ինչ է ասվում: