Keeletehnoloogia ressursid: |
TAHMM, ESTMORFi tulemuste ühestaja
- Mooduli kirjeldus
- FTP server
Morfoloogiline ühestaja on programm, mis morfoloogilise analüsaatori väljundist valib iga sõna analüüsidest just selle, mis antud konkreetses kontekstis on õige.
TAHMM on lühend sõnadest "tagger, Hidden Markov Model". Tegemist on statistilise ühestajaga, mis õige morfoloogilise analüüsi valimiseks kasutab varjatud Markovi mudeli abil koostatud statistilisi tabeleid ja Viterbi algoritmi. Tabelite koostamisel kasutati vabalt levitatavat programmi ISSCO tagger, mis on koos dokumentatsiooniga aadressil http://issco-www.unige.ch/tools/.