Keeletehnoloogia ressursid: AVALEHEKÜLG  ·  TUTVUSTUS  ·  PROJEKTID  ·  TARKVARA  ·  DEMOD  ·  LINGID  

Eesti Keeletehnoloogia Sihtprogramm
Tarkvara

Nimisõnafraaside filtreerija

Programm nimisõnafraaside leidmiseks jooksvast tekstist. Vajalik nii süntaktilise analüüsi edasiarendusel kui ka iseseisva moodulina terminite jm mitmest sõnast koosnevate tervikmõistete eraldamiseks.

Inglise-eesti sõnastik

Inglise-eesti toorandmebaas. Rakendusprogramm sobib kasutamiseks tavalise arvutisõnastikuna, pikemas perspektiivis loodame, et valmiv andmebaas leiab kasutust masintõlkele orienteeritud rakendustes.

ESTMORF, eesti keele morfoloogiline süntees ja analüüs

ESTMORF leiab tekstis esinevate sõnavormide võimaliku(d) tüve(d) ning määrab, millises käändes või pöördes sõna on. Sõnastikus puuduvad sõnad saavad oletustüved. Leitud tüvesid võib järgnevalt otsida sõnastikust (eesti-inglise, seletav sõnaraamat vms). Sünteesirežiimis genereerib ESTMORF algvormist soovitud vorme (nt maja > majja), soovitusrežiimis pakub kirjaveaga sõnavormide võimalikke korrektseid kirjapilte (maija > maja, majja, maika...). ESTMORF töötab DOSi keskkonnas. Veebidemo.

EKI morfoloogiamoodulid

Windowsi dll-id silbituseks, morfoloogiliseks analüüsiks ja sünteesiks, tüvemoodustuseks ja tüübituvastuseks. Kaasas on ka täisfunktsionaalne analüüsi/sünteesi näidisprogramm.

TAHMM, ESTMORFi tulemuste ühestaja

Morfoloogiline ühestaja on programm, mis morfoloogilise analüsaatori väljundist üritab leida iga sõna analüüsivariantidest konkreetses kontekstis sobiva. TAHMM on lühend sõnadest "TAgger, Hidden Markov Model". Tegemist on statistilise ühestajaga, mis õige morfoloogilise analüüsi valimiseks kasutab varjatud Markovi mudeli abil koostatud statistilisi tabeleid.

Eesti keele kõnesüntees ja ekraanilugeja

Kõnesüntees on rakendus, mis muudab etteantud teksti kõneks ja saadab tulemuse arvuti kõlaritesse. Veebidemo.

ELA, teksti lausestaja

Lausestaja on programm, mille ülesandeks on eestikeelse sisendteksti jagamine lauseteks.