Eesti keele tekst-kõne süntees (testversioon)
Meelis Mihkla,
Arvo Eek, Einar Meister
Meie tekst-kõne sünteesiprojekti eesmärgiks on
teisendada eestikeelne ortograafiline tekst (elektroonilisel kujul),
ortoeepiliseks loomuliku kõlaga kõneks. Eesti keele
tekst-kõne süntees on Eesti Keele Instituudi ja Küberneetika
Instituudi ühisprojekt, mis käivitus kaks aastat tagasi.
Oleme liitunud rahvusvahelise kõnesünteesi MBROLA
projektiga. Meie kõnesüntees põhineb difoonidel.
Difoonid on kahest järjestikusest häälikust (konsonant-vokaal,
vokaal-konsonant, vokaal-paus, jne) koosnevad segmendid. Eestikeelse
kirjaliku teksti teisendamine sünteeskõneks eeldab:
- lingvistilist keeletöötlust,
- kõne prosoodilise struktuuri modelleerimist,
- difoonide andmebaasi loomist.
Signaali töötluseks kasutame MBROLA süntesaatorit. Väga
suur osa kõnesüntesaatori väljatöötamisel
(lingvistiline keeletöötlus) on eesti keeletehnoloogidel
H.-J. Kaalep ja T. Vaino OÜ Filosoftist ja Ü. Viks,
E. Kuusik ja I. Hein Eesti Keele Instituudist, kes on teinud teksti
analüüsi ja automaatse märgenduse. Süntesaatori
esimese rakenduse ekraanilugeja on kirjutanud Peeter Tatter Tallinna
Tehnikaülikoolist. Sünteesiprojekti on toetanud ja toetavad
Eesti Teadusfond, Avatud Eesti Fond, A. Kordelini Fond ja Eesti
Informaatikakeskus keeletehnoloogia projekti raames.
Süntesaator töötab operatsioonisüsteemiga Windows. Nõuded
riistvarale on minimaalsed.
Eesti keele tekst-kõne sünteesi programmid on kasutatavad
priivarana mitteärilisteks ja mittesõjalisteks eesmärkideks.
Süntesaatori installeerimine
- Laadi ja käivita programm
mbrolatools311,
kas käesolevalt koduleheküljelt (see programmivariant
ei pruugi olla kõige uuem) või MBROLA koduleheküljelt
http://tcts.fpms.ac.be/synthesis
Soovitatav on need programmid installeerida
vaikimisi pakutavasse kataloogi C:\Program Files\Mbrola Tools.
- Tõmba ja lase käima
syntv10.exe,
taas kord võiks programmid installeerida
vaikimisi pakutavasse kataloogi C:\Program Files\Mbrola Tools.
- Installeeri difoonide andmebaas: Settings - Control Panel
- Mbrola. Eestikeelne difoonide andmebaas
ee1 on kataloogis C:\Program Files\Mbrola Tools\ee.
Süntesaatori ja ekraanilugeja käivitamine
- Käivita programm loe.exe aadressil
C:\Program Files\Mbrola Tools\ee. See programm jääb
taustprogrammiks.
- Vali tekstitöötlusprogrammis (Word, PFE, Netscape, vm)
välja mingi tekstilõik hiirega või
klahvikombinatsiooniga. Vajuta Ctrl-C, seejärel tee hiirega
klõps "Loe" nupul. Kui arvutil on
helikaart ja kõlarid või kõrvaklapid sisse
lülitatud peaks väljavalitud tekst kostuma suulise
kõnena. Sama teksti kordus toimub "Korda"
nupule vajutamisega.
Märkused
- Minimaalse pikkusega lõik süntesaatorile on üks
lause, mis peab lõpus kindlasti sisaldama punkti vm
lauselõpumärki.
- Süntesaatori sisemine puhver ei võimalda praegu
väga pikka lõiku korraga süntesaatorile ette sööta
(maksimaalselt u. pool lehekülge).
- Tekstis olevate numbrite, lühendite ja erimärkidega
ei oska süntesaatori testversioon veel midagi mõistlikku
väljundisse saata.