Fonetikai tulajdonságok alapú ábécé készítése
Absztrakt
A karakterek, betűk kódolása a természetes nyelvek feldolgozása során leggyakrabban a hétköznapi ábécé alapján történik. Ezen kódolásban minden betű egy független kategóriát jelöl, melyek közötti nincs távolság értelmezve. Sok esetben viszont az egyes betűk fonetikai tulajdonságai hatással vannak a különböző nyelvtani szabályokra. A cikk a hagyományos és a fonetikai alapú kódolás hatékonyságát veti össze. Az egyes fonetikai tulajdonságok alapján a betűk vektortérben reprezentálhatóak, közöttük a távolság meghatározható. A vektortérből dimenziócsökkentéssel történő leképzés eredménye egy olyan új ábécé, melyben az egyes elemek közötti távolságok a vektortérbeli távolságokkal arányosak. A kapott ábécé a magyar nyelv ragozásának tanulásánál hatékonyabban alkalmazható, mint a hagyományos ábécé.