Eesti Keele Instituut

EKI tarkvara


MORFOLOOGILINE SÜNTEES


andmefailid



programmid



lähtekood (C)

Morfoloogiline süntees

 


Morfoloogilise sünteesi e vormimoodustuse ülesandeks on genereerida antud sisendsõnast kõik võimalikud muutevormid. Tüüpiline kasutus vormimoodustusele on kas tervete paradigmade süntees või vastused tüüppäringutele à la Kuidas on osastav kääne sõnast pension? Pensioni või pensionit? või Kas ta satub või sattub raskustesse? Ääremärkuse korras olgu öeldud, et kõik need variandid on lubatud.

Vt lisaks Muutüüpide, sõnaliikide, tüvekoodide ja vormikoodide tähistused ning moodulite üldiseloomustus.

Nagu ka teiste morfoloogiamoodulite puhul eeldab morfoloogiline süntees sisendina eestikeelse sõna väiketähtedega kirjutatud algvormi, milles välde võib olla märgitud. Sisendit käsitletakse lihtsõnana, liitsõnad tuleb eelnevalt osadeks jagada.

Sünteesi väljund on terve paradigma, üksikvormid saab sealt leida. Paralleeltüüpidel ja homograafidel (poodium 19~02, ehe 02|05|06) moodustatakse ja väljastatake mitu paradigmat.


Süntees alustab tööd tüübituvastusega, paradigma liikmete moodustamine on kirjeldatud failis form.rul. Seejärel kasutab süntees nõutud tüvede moodustamiseks tüvemuutuste moodulit ja liidab leitud tüvedele käände- või pöördelõpud.

Kuidas käänata sõna palk?

  • tüübituvastus ütleb, et palk kuulub muuttüüpi 22 ja on nimisõna
  • form.rul sisaldab reegleid: tüübis 22 tuleb ainsuse nimetav moodustada tüvevariandist at ilma käändelõputa, mitmuse nimetav (sisekood ------1N) tekib, kui ühendada tüvevariant bn lõpuga 'd' jne
  • form.exc ühtki vormi erandlikuks ei pea
  • tüvedmoodustus leiab failis ab_ba.exc erandliku 22 p'alk p'alka >, nokk rea lõpus märgib, et ka reeglipärane p'alki (viimane rida e vaikimisi reegel failis rules_ab.rul) tuleb moodustada ja süntees genereerib kaks paradigmat.


1. Kui installeerite esimest korda, looge esmalt sobiv kataloogipuu. Loogiline kataloogide struktuur võiks olla:

c:\eki_morfo\programmid\                (programmid)
c:\eki_morfo\programmid\vormimoodustus\ (lähtekood vajadusel)
c:\eki_morfo\andmed\                    (andmefailid)

2. Laadige oma arvutisse andmefailid (est_morpho_data.zip) ja pakkige need lahti andmekataloogi. Andmefailid võivad küll asuda samas kataloogis programmide ja teekidega, parem lahendus on aga hoida andmefaile omaette kataloogis ja panna selle nimi keskkonnamuutujasse EST_MORPHO_DATA (vt juhend).

3a. Installeerige silbituse, tüübituvastuse ja tüvemuutuste moodulid, neid kõiki on sünteesil vaja.

3. Laadige oma arvutisse programmid (synt_bin.zip) ja pakkige lahti morfoloogiaprogrammide kataloogi.

(4.) Kui leiate, et teile pakub huvi programmide lähtekood või, mis veel parem, olete valmis seda täiustama, laadige oma arvutisse koodifailid (synt_code.zip) ja pakkige lahti programmide kataloogi sobiva nimega alakataloogis.

Morfoloogiline süntees koosneb:

teegid:

  • silbitus
  • tüübituvastus
  • tüvemuutused
  • fmsynth.dll (vormide süntees)

andmefailid:

  • form.rul (sünteesi kombinatoorikareeglid)
  • form.exc (vormimoodustuse erandid)

Esimesel käivitamisel teeb moodul erandifailist enda jaoks sobivama indeksi laiendiga form.ndx. Kui muudate vormimoodustuse erandeid, aga programm käitub vanaviisi, kustutage ndx-laiendiga fail ja käivitage programm uuesti.


Tegemisel:

  • sünteesida on mõistlik korraga terve paradigma, sest vajaminevad tüved moodustatakse kõik, aga üksiku vormi küsimine võiks sellegipoolest eraldi funktsioonina olemas olla;
  • versiooninumbri kontroll puudu.


Programme puudutavad küsimused: tarkvara@eki.ee