Eesti keele tekst-kõne süntees (testversioon)

Meelis Mihkla, Arvo Eek, Einar Meister

NB! Uuema kirjelduse ja tarkvara leiate keeletehnoloogia rubriigist!

Meie tekst-kõne sünteesiprojekti eesmärgiks on teisendada eestikeelne ortograafiline tekst (elektroonilisel kujul), ortoeepiliseks loomuliku kõlaga kõneks. Eesti keele tekst-kõne süntees on Eesti Keele Instituudi ja Küberneetika Instituudi ühisprojekt, mis käivitus kaks aastat tagasi. Oleme liitunud rahvusvahelise kõnesünteesi MBROLA projektiga. Meie kõnesüntees põhineb difoonidel. Difoonid on kahest järjestikusest häälikust (konsonant-vokaal, vokaal-konsonant, vokaal-paus, jne) koosnevad segmendid. Eestikeelse kirjaliku teksti teisendamine sünteeskõneks eeldab:

  1. lingvistilist keeletöötlust,
  2. kõne prosoodilise struktuuri modelleerimist,
  3. difoonide andmebaasi loomist.
Signaali töötluseks kasutame MBROLA süntesaatorit. Väga suur osa kõnesüntesaatori väljatöötamisel (lingvistiline keeletöötlus) on eesti keeletehnoloogidel H.-J. Kaalep ja T. Vaino OÜ Filosoftist ja Ü. Viks, E. Kuusik ja I. Hein Eesti Keele Instituudist, kes on teinud teksti analüüsi ja automaatse märgenduse. Süntesaatori esimese rakenduse ekraanilugeja on kirjutanud Peeter Tatter Tallinna Tehnikaülikoolist. Sünteesiprojekti on toetanud ja toetavad Eesti Teadusfond, Avatud Eesti Fond, A. Kordelini Fond ja Eesti Informaatikakeskus keeletehnoloogia projekti raames.

Süntesaator töötab operatsioonisüsteemiga Windows. Nõuded riistvarale on minimaalsed.

Eesti keele tekst-kõne sünteesi programmid on kasutatavad priivarana mitteärilisteks ja mittesõjalisteks eesmärkideks.

Süntesaatori installeerimine

  1. Laadi ja käivita programm mbrolatools311, kas käesolevalt koduleheküljelt (see programmivariant ei pruugi olla kõige uuem) või MBROLA koduleheküljelt http://tcts.fpms.ac.be/synthesis Soovitatav on need programmid installeerida vaikimisi pakutavasse kataloogi C:\Program Files\Mbrola Tools.
  2. Tõmba ja lase käima syntv10.exe, taas kord võiks programmid installeerida vaikimisi pakutavasse kataloogi C:\Program Files\Mbrola Tools.
  3. Installeeri difoonide andmebaas: Settings - Control Panel - Mbrola. Eestikeelne difoonide andmebaas ee1 on kataloogis C:\Program Files\Mbrola Tools\ee.

Süntesaatori ja ekraanilugeja käivitamine

  1. Käivita programm loe.exe aadressil C:\Program Files\Mbrola Tools\ee. See programm jääb taustprogrammiks.
  2. Vali tekstitöötlusprogrammis (Word, PFE, Netscape, vm) välja mingi tekstilõik hiirega või klahvikombinatsiooniga. Vajuta Ctrl-C, seejärel tee hiirega klõps "Loe" nupul. Kui arvutil on helikaart ja kõlarid või kõrvaklapid sisse lülitatud peaks väljavalitud tekst kostuma suulise kõnena. Sama teksti kordus toimub "Korda" nupule vajutamisega.

Märkused

  1. Minimaalse pikkusega lõik süntesaatorile on üks lause, mis peab lõpus kindlasti sisaldama punkti vm lauselõpumärki.
  2. Süntesaatori sisemine puhver ei võimalda praegu väga pikka lõiku korraga süntesaatorile ette sööta (maksimaalselt u. pool lehekülge).
  3. Tekstis olevate numbrite, lühendite ja erimärkidega ei oska süntesaatori testversioon veel midagi mõistlikku väljundisse saata.