Kuna korpuspõhine süntees eeldab teksti- ja kõnekorpusi, siis on tekkinud:

  • Kaks tekstikorpust täiskasvanud lugejale: 697 ja 3350 lausega.

  • Lastekorpus 1956 lausega

  • 8 keelejuhi kõnekorpused: kolm meeshääle korpust "Einar", "Tõnu" ja "Tõnis"; neli naishääle korpust "Madli", "Riina", "Liisi" ja "Eva" ning üks lapshääle korpus "Luukas". Kõnekorpus "Eva" sisaldab lisaks 2000 lausele ka 11000 üksikut sõna ja sõnavormi.

Kui teil on huvi kasutada kõnekorpust (foneemi tasandil märgendatud ja segmenteeritud helifailid) teaduslikel eesmärkidel, siis võtke palun ühendust Liisi Piitsaga, See e-posti aadress on spämmirobotite eest kaitstud. Selle nägemiseks peab su veebilehitsejas olema JavaSkript sisse lülitatud., tel 6177506. Kõnekorpuse kasutamise tingimused fikseeritakse vastavas lepingus.

 

Kõnesünteesikorpuste analüüsi ja täiendamise programmipakett võimaldab:

  • komlekselt analüüsida korpuse struktuuri lause-, fraasi-, sõna-, silbi- ja foneemitasandil;
  • esile tuua foneemide, diftongide ja difoonide jaotuste statistika;
  • otsida baaskorpusest lauseid, mis sisaldavad foneeme sobivas ümbruses (eelmise ja/või järgmise foneemi määratlemisega) ning erineva asendiga sõnas (rõhulises või rõhuta silbis) ja/või fraasis (fraasi alguses, keskel või lõpus).

Kõnesünteesikorpuste analüüsi ja täiendamise programmipaketikasutusjuhend.

Programmide lähtekoodid on kättesaadavad VisualStudio2008 projektidest.