SIHTFINANTSEERITAVAD TEADUSTEEMAD 2003–2007

Tänapäeva eesti keele leksikaalne ja grammatiline struktuur
Eesti keele geograafiline ja diakrooniline teisenemine

Tänapäeva eesti keele leksikaalne ja grammatiline struktuur

Teema nr 0052488s03.
Teemajuht dr Urmas Sutrop

Teadusteema “Tänapäeva eesti keele leksikaalne ja grammatiline struktuur” peamiseks ülesandeks on anda mitmekülgne ja samas terviklik käsitlus tänapäeva eesti kirjakeele leksikaalsest ja grammatilisest struktuurist. Kavandatav uurimistöö kuulub oma olemuselt keeleteaduslike alusuuringute valdkonda, millele liituvad mitmed rakenduslikud aspektid. Alus- ja rakendusuuringud keskenduvad eesti keele leksikaalse ja grammatilise struktuuri, selle korralduse ja formaalse esituse järgmistele valdkondadele:

1. Kirjakeele sõnavara semantiline analüüs, sõnavarakihid ja leksikoniteooria

2. Keelekorraldus ja terminoloogia

3. Grammatika ja leksikoni seosed

4. Keeletehnoloogia ja arvutilingvistika

Uurimistöö annab uusi teadmisi eesti keele leksikaalse ja grammatilise struktuuri, selle korralduse ning formaalse esituse kohta. Mitmete aspektidega rikastab uurimistöö ka üldkeeleteadust. Uurimistöö tulemused leiavad rakendust akadeemilistes sõnaraamatutes, keelekorralduses, terminoloogias ja keeletehnoloogias, millega tagatakse eesti keele leksikaalse ja grammatilise struktuuri loomulik areng. Uurimistöö ja selle tulemuste rakendustega antakse oluline panus Eesti riigi ja kultuuri toimimisse, tagatakse, et eesti keel oleks jätkuvalt täisväärtuslik ja kõigis eluvaldkondades toimiv riigikeel.

Kavandatava uuringu üldteoreetiline taust ning selle koht üldteadmiste foonil

Käesoleva teema peaülesanne on anda terviklik käsitlus tänapäeva eesti kirjakeele eri aspektidest. Ühtseks tervikuks püütakse liita eesti keele leksikaalse ja grammatilise struktuuri uurimine ja kirjeldamine. Kavandatav suuremahuline uurimistöö lähtub keeleteaduses aktsepteeritud nüüdisaegsetest keeleuurimise strukturaalsetest teooriatest, millele mitmes aspektis liitub kognitiivne lähenemine. Üha enam muutub uurimistöö korpustepõhiseks. Uurimistööga kavatsetakse jätkata eesti keeleteaduse parimaid traditsioone. Jätkatakse ka Eesti Keele Instituudis seni tehtut. Plaanitakse teha koostööd Tartu Ülikooli ja Tallinna Pedagoogikaülikooli eesti keele osakondadega, vältimaks tarbetut teadustöö dubleerimist.

Uuringu iseloom

Uurimistöö kuulub oma olemuselt keeleteaduslike alusuuringute valdkonda. Samas liituvad sellele mitmed rakenduslikud aspektid.

Uuringu põhieesmärgid, hüpoteesid ja meetodid

Uuringu üldeesmärk on eesti keele leksikaalse ja grammatilise struktuuri terviklik kirjeldamine. Lähtutakse hüpoteesist, et eesti keele sisemine loomulik areng on häiritud vene keele ning pealetungiva inglise keele mõjul. Sellest tulenevalt eeldatakse, et eesti keele leksikaalse ja grammatilise struktuuri loomulik areng tagatakse keelekorralduse, terminoloogia, leksikoloogia, grammatika ja keeletehnoloogia arendamisega.

Eesti keele kestmine ja areng infotehnoloogia keskkonnas vajab leksikaalsete ja grammatiliste struktuuride integratsiooni. Sõna kasutamiseks suhtlusprotsessis (ja eriti arvutirakendustes) ei piisa üksnes tema võimalike tähenduste või grammatiliste omaduste teadmisest, need tuleb omavahel seostada.

Uurimistöös kasutatakse keeleteaduse traditsioonilisi uurimismeetodeid, millele lisanduvad arvutilingvistilised ja korpusepõhised uurimismeetodid.

Uuringu konkreetsed eesmärgid on seotud eesti keele leksikaalse ja grammatilise struktuuri, selle korralduse ja formaalse esituse järgmiste valdkondadega.

1. Kirjakeele sõnavara semantiline analüüs, sõnavarakihid ja leksikoniteooria

Valdkond keskendub eesti keele sõnade (ka komponentide ja mitmesõnaliste ühendite) tähenduse ja tähendussuhete kirjeldamisele ja esitusele. Leksikoniteooria uurib leksikaalsete kirjete struktuuri, sõnaraamatu ülesehitust ja metakeelt, leksikoni rolli keele grammatikasüsteemis (vt ka allteema „Grammatika ja leksikoni seosed“). Allteema täitmine on tihedalt seotud “Eesti kirjakeele seletussõnaraamatu” ja “Eesti-vene sõnaraamatu” koostamisega, samuti eesti–X-keele sõnastiku (EXS) eesti poole kui ühtse aluse ettevalmistamisega tulevaste instituudis tehtavate kakskeelsete sõnastike jaoks. EXS toetub EKI akadeemiliste baassõnaraamatute ja eesti tekstikorpuste andmestikule ja arvestab uuemaid arenguid sõnavaras ja grammatikas.

2. Keelekorraldus ja terminoloogia

Valdkond hõlmab keelekorralduse üldiselt ja lisaks allosadena oskuskeelekorralduse (terminoloogia) ning nimekorralduse. Valdkonna raames tegeldakse keelekorraldusteooriaga, uuritakse keelekorralduse põhimõtteid ning konkreetselt eesti keelekorralduse ajalugu. Lisaks vaadeldakse oskuskeele teooriat ning nimekorralduse teoreetilisi aluseid. Allteema täitmine on tihedalt seotud praktilise poolega: keelekorralduslike soovituste ning “Eesti keele sõnaraamatu (ÕS 1999)” uustrüki ettevalmistamisega.

3. Grammatika ja leksikoni seosed

Valdkond keskendub grammatiliste kategooriate realiseerimisvõimalustele leksikonis ja tekstis. Põhirõhk on kategooriatel, mis osalevad eesti kirjakeele vormi- ja sõnamoodustuses. Uurimistulemused koondatakse eesti keele leksikaal-grammatilisse andmebaasi, mis sisaldab integreeritud andmeid kõigi keeletasandite kohta foneetikast semantikani. Lisaks uuritakse eesti keele grammatikavahendite kasutuse kujunemist, tänapäeva grammatikalisatsiooniprotsesse, eesti süntaksi võõrmõjustusi, eesti tuletiste ja liitsõnade struktuuri jne.

4. Keeletehnoloogia ja arvutilingvistika

Valdkonna sisuks on ühelt poolt lähteuuringud, tagamaks eesti keele täisväärtuslikku toimimist infotehnoloogia pideva arenemise ajastul, teiselt poolt rakendused, mis toetavad teiste allteemade täitmist vajalike keeletehnoloogiliste vahendite väljatöötamise kaudu. Temaatiliselt on see valdkond EKI-s seotud kolme uurimissuunaga: kõnetehnoloogia, grammatika ja leksikograafia. Tulemused realiseeruvad peamiselt kahel kujul: eelkõige keeleressurssidena (elektroonilised sõnastikud, andmebaasid, formaalsed grammatikad, tekstikorpused), aga ka keeletarkvarana (keelemoodulid prototüübi tasemel).

Uuringu teostajate teaduspotentsiaal

Uuringu teostajate teaduspotentsiaal on kõrge. See on leidnud kinnitust Eesti Keele Instituudi teaduslikes saavutustes, mida kroonivad alusuuringutel põhinevad tähtteosed, nagu akadeemiline “Eesti kirjakeele seletussõnaraamat” (publitseeritud on A – tinakas), kaheköiteline akadeemiline “Eesti keele grammatika” ja “Eesti keele sõnaraamat ÕS 1999” (viimased kaks on saanud teaduspreemia). Mitmed Eesti Keele Instituudi teadlased on võitnud rahvusvahelise (ja ka kodumaise) tunnustuse, paljud osalevad meie ülikoolide õppetöös loengute ja seminaridega või magistri- ja doktoritööde juhendamisega.

Uuringute eeldatavad tulemused ja võimalikud jätkamissuunad

1. Kirjakeele sõnavara semantiline analüüs, sõnavarakihid ja leksikoniteooria.

Alus- ja rakendusuuringute tulemusena valmib:

1) Lõpetatakse “Eesti kirjakeele seletussõnaraamat”. Aastail 2003–2007 ilmuvad 23. vihik – 27. vihik, viimasega koos ilmub ka uute sõnade täiendvihik (28.).

2) Lõpetatakse “Eesti-vene sõnaraamatu” 4. ja 5. köide.

3) Eesti–X-keele sõnastiku (EXS) eesti pool. EXS ei sõltu vastete keelest ega tulemsõnastiku mahust. EXS on elektrooniliselt töödeldav (kasutatakse XML-märgendust), maht on esialgu ca 40 000 märksõna. EXS-i koostatakse andmestruktuuride kaupa (mitte alfabeetiliselt).

4) Pidevalt koostatakse ka kahte andmebaasi: a) uute sõnade andmebaas (USS) on elektroonilises vormis sõnakogu, mis koondab erisugust infot eesti uuema sõnavara kohta. USS-i põhjal valmib “Eesti kirjakeele seletussõnaraamatu” täiendvihik (2007. a). Märksõnad on valitud nende üldkäibivuse ja sageduse järgi tegelikus keelekasutuses ja tekstikorpustes, teisi sõnaraamatuid on kasutatud toetava allikana. b) võõrsõnade andmebaas (VSAB) koondab eesti kirjakeeles käibel olevaid eeskätt uuemaid võõrsõnu, moodustades ühe osa uute sõnade andmebaasist.

5) Uurimistöö põhjal on plaanitud teaduslikud publikatsioonid järgmistel teemadel: põhisõnavara ja sõnavara struktuur; leksikaalne semantika hierarhilises leksikonis (regulaarne polüseemia); religioonisõnavara; homonüümia eesti keeles; neologismide osa eesti keele struktuuris; võõrsõnad eesti keeles; emotsioonisõnavara.

2. Keelekorraldus ja terminoloogia.

Tulemused on seotud praktilise väljundiga:

1) Keelekorraldus – oskuskeelekorraldus, selle põhimõtted ja ajalugu.

2) Nimekorraldus – kohanimede normimine ja kohanimeandmebaas, osaletakse Eesti kohanimede sõnaraamatu koostamises.

3) Üksikuurimustena valmivad tööd: inglise laenud ja nende mõju eesti keelele; eesti tuletussüsteemi arenemine keelekorralduslikust seisukohast; terminoloogia areng (suurem rõhk majandus- ja rahandusterminitel).

4) Lisaks koostatakse kaht andmebaasi: a) keelenõuande andmebaas – registreeritakse jooksvalt kõik keelenõuanded (olemas juba varasemad aastad, kavas on üle minna nõuannete jooksvale sisestamisele, asendades senise žurnaali); andmebaas on põhimõtteliselt ligipääsetav ka Interneti kaudu; b) normitud kohanimede andmebaas - Eesti ja välisriikide kohanimed, praegu olemas ka Internetis; (arvatavasti seotakse andmebaas tulevikus ka riigi kohanimeregistriga, samuti võib-olla üleeuroopaliste kohanimeandmebaaside projektiga).

5) Uurimistöö tulemusena valmib “Eesti keele sõnaraamatu ÕS 1999” uus aktualiseeritud ja täiendatud versioon ÕS 2005.

6) Valmib ka väike koolidele mõeldud eesti keele sõnaraamat ÕS.

3. Grammatika ja leksikoni seosed.

1) Koostatakse eesti keele leksikaal-grammatiline andmebaas, mis on aluseks ja andmeallikaks mitmetele erinevatele rakendustele (teoreetilised uurimused, tarkvarasüsteemid, erinevad sõnastikud (EXS, kakskeelsed ja ükskeelsed sõnastikud nii raamatuna kui ka veebiversioonis).

2) Lisatakse grammatiline info EKI-s koostatavatesse sõnastikesse.

3) Publitseeritakse artikleid grammatiliste kategooriate kombinatoorikast sõnavormis ja sõnas, struktuuridest ja protsessidest sõnamoodustuses, grammatikaliseerumis­protsessidest, võõrmõjutustest süntaksis.

4. Keeletehnoloogia ja arvutilingvistika.

Tulemused hõlmavad mitut valdkonda ja realiseeruvad nii keeleressursside kui ka tarkvara kujul.

1) Kõnetehnoloogia alal koostatakse eesti keele lauseprosoodia formaalne kirjeldus ja luuakse kõnesünteesi tarkvaramoodulid.

2) Grammatika vallas valmivad sõnamoodustuse formaalne grammatika ning morfoloogilise ühestamise formaalne grammatika; tarkvara poolel täiendatakse reeglipõhiseid morfoloogiamooduleid sõnamoodustuse osas (tuletus, liitsõnad) ning luuakse morfoloogilise ühestaja liides morfoloogiamoodulitega.

3) Automaatses leksikograafias jätkatakse EKI sõnastike struktureerimist ja standardiseerimist; luuakse nn leksikograafi töökoht ehk sisevõrgus kasutatav süsteem, mis koondab ühtsesse töökeskkonda olemasolevad sõnastikud ja sõnastike koostamise tarkvara.

4) Lisaks arendatakse avalikke teenuseid Internetis KeeleWebi kaudu: luuakse intelligentne päringusüsteem sõnastike jaoks, kuhu on integreeritud ka keeletarkvara; lahendatakse keelenõuinfot veebis; avalikku kasutusse antakse EKI sõnastike veebiversioonid.

Teema jätkamissuunad peavad tagama eesti keele täisväärtusliku toimimise riigikeelena. Uurimisteema võimalikeks jätkusuundadeks on (1) sõnavara muutumine, kollokatsioonid, sõnavara stilistilised tasandid ja kontrastiivne leksikoloogia (vene ja inglise keele mõju eesti keele sõnavarale), sõnavara tuumtähenduste uurimine üheköitelise seletussõnaraamatu jaoks; (2) terminoloogia ja keelekorralduse alus- ning rakendusuuringud, et tagada keelekorralduse ja terminoloogiatöö edukus; (3) eesti-vene grammatika kontrastiivsed uurimistööd, grammatika ja leksikoni seoste uurimine, muulaste keeleõppega seotud probleemid; (4) alus- ja rakendusuuringud, mis tagavad eestikeelse arvutikeskkonna toimimise ja suudavad leida lahendusi tehnoloogia arengu poolt eesti keelele esitatavale uutele väljakutsetele.

Eeldatav tähtsus teadusele ning Eesti majandusele ja kultuurile

Uurimistöö annab uusi teadmisi eesti keele leksikaalse ja grammatilise struktuuri, selle korralduse põhimõtete ning formaalse esituse võimaluste kohta. Mitmete aspektidega rikastab uurimistöö ka üldkeeleteadust. Uurimistöö tulemused leiavad rakendust akadeemilistes sõnaraamatutes, praktilises keelekorralduses, terminoloogias ja keeletehnoloogias. Uurimistöö ja selle tulemuste rakendustega antakse oluline panus Eesti riigi ja kultuuri toimimisse, tagatakse, et eesti keel oleks jätkuvalt täisväärtuslik ja kõigis eluvaldkondades toimiv riigikeel.

Eesti keele geograafiline ja diakrooniline teisenemine

Teema nr 0052487s03.
Teemajuht dr Kristiina Ross

Teadusteema “Eesti keele geograafiline ja diakrooniline teisenemine” on loogiliseks jätkuks EKI murde- ja soome-ugri keelte sektoris varem tehtud uuringutele. Teema raames sünteesitakse eesti murrete, sugulaskeelte ja kontaktmõjutuste uurimisel saadud tulemusi. Teema eesmärgiks on täpsustada ja korrigeerida seniseid arusaamu eesti keele sisearengutest ning uurali, indoeuroopa jt komponentide ajaloolisest põimumisest eesti keeles. Teadusteema hõlmab eesti murdesõnavara ja murdegeograafia alaseid uuringuid ning problemaatikat, mis puudutab eesti keele diakroonilisi seoseid sugulas- ja kontaktkeeltega. Teema teoreetilised tulemused artikliseerijatena ning rakenduslikud väljundid sõnaraamatutena loovad aluse edaspidisteks süvauuringuteks eesti keele ajaloolise kujunemise alal.

Üldteoreetiline taust

Teadusteema "Eesti keele geograafiline ja diakrooniline teisenemine" on loogiliseks jätkuks EKI murde- ja soome-ugri keelte sektoris seni tehtud uuringutele eesti murrete ja sugulaskeelte alal. Kahe sektori ühinemise järgselt (alates 1998. aastast) on olnud võimalik teineteisele lähendada eesti keele sisearenguid uurivat suunda ja sugulaskeeltega tegelevat uurimisharu. Viimasel ajal on hakatud pöörama rohkem tähelepanu ka kontaktkeelte mõjule nii eesti keele sõnavara kui grammatika kujunemisel. Kõik see on loonud head eeldused kolme uurimissuuna (murded, sugulaskeeled, kontaktkeeled) sünteesimiseks.

Põhieesmärgid ja uuringu iseloom

Uurimisteema põhieesmärgiks on täpsustada ja korrigeerida seniseid arusaamu uurali, indoeuroopa jt komponentide ajaloolisest põimumisest eesti keeles. Esialgseks tööhüpoteesiks on oletus, et eesti keel on oma ajaloolise arengu käigus jõudnud struktuuri ja semantika poolest indoeuroopa keeltele märksa lähemale, kui seni tavaks arvata. Sugulaskeelset liini pidi on saadud peamiselt vaid materjal, mida kasutades see uus keelevariant funktsioneerib.

Uurimisel kasutatakse nii ajaloolis-võrdleva kui strukturaalse lingvistika meetodeid.

Teema alla kuulub kaks teineteisega seotud, ent siiski eraldi käsitletavat kompaktset allteemat:

a) eesti murdesõnavara ja murdegeograafia,

b) eesti keele diakroonilised seosed sugulas- ja kontaktkeeltega.

Esimene allteema hõlmab eesti keele geograafiliste variantide sõnavara ja grammatiliste joonte uurimist. Rõhuasetus on siinjuures diakrooniline, s.t uuritavaks aineseks on  ajaloolised murded ja murrakud, nii nagu nad olid välja kujunenud 19. sajandi lõpuks ja 20. sajandi esimeseks pooleks ning nagu nad kajastuvad EKI murde- ja lähisugukeelte sektori kasutada olevates materjalides (paberkandjatel murdearhiiv sisaldab üle 5 miljoni sedeli ja ligi 140 000 lk teksti; heliarhiivis on talletatud umbes 2830 tundi helilindistusi). Tegemist on unikaalse keelematerjaliga, mida on kogutud alates 1920. aastatest, eelistavalt võimalikult puhta lokaalse keelevariandiga vanematelt keelejuhtidelt. Kuivõrd ajaloolised murded on tänaseks praktiliselt hääbunud, annab selle materjali valdamine EKI murdeuurijatele ainulaadse võimaluse ajalooliste geograafiliste keelenähtuste selgitamiseks, kuid paneb neile ühtlasi ka kohustuse teha kõnealused materjalid üldkättesaadavaks.

Teine allteema hõlmab probleeme, mis on seotud eesti keele sõnavara ja grammatiliste joonte päritoluga, s.t soomeugriliste joonte ja kontaktkeeltelt ajaloo jooksul saadud mõjutuste väljaselgitamise ning analüüsimisega. Uurimise lähtebaasiks on EKI murde- ja lähisugukeelte sektoris koostatud eesti keele etümoloogiline kartoteek ja sektori uurijate senised tulemused uurali keelte grammatiliste nähtuste analüüsil ning eesti vana kirjakeele tõlkelisuse uurimisel.

Konkreetsed allprojektid, mille tulemused avaldatakse artikliseeriatena:

* Sugulas- ja kontaktkeelte sõnavaralised suhted

* Balti-läänemeresoome keelekontaktid

* Uurali ja kontaktkeelte grammatilised suhted

* Venemaa eestlaste keelesuhted

* Lähtekeelte mõjud 16., 17. ja 18. sajandi eesti tõlkekeeles

* Eesti koha- ja isikunimede kujunemine

Kuivõrd üks EKI olulisi funktsioone on eesti keelt puudutavate materjalide süstematiseerimine ning kättesaadavaks tegemine, on enamikul nimetatud uuringutest olemas ka rakenduslik aspekt ning väljund üldkasutatavate paberkandjal sõnaraamatute, CD-de ja elektrooniliste andmebaaside näol. Et tegemist on esimeste seda laadi materjalidega eesti keele alal, pole võimalik hoida nende koostamist lahus uurimistööst. Suuresti kahasse riikliku programmi "Eesti keel ja rahvuskultuur" alt saadava finantseeringuga on kavas järmised rakendusliku väljundiga projektid:

* Eesti murrete sõnaraamat. Sihtfinantseeringu perioodil jätkub sõnaraamatu väljaandmine. Kuivõrd praeguseks on varasematel aastatel koostatud osad toimetatud ja lõviosas ka trükis ilmunud, tuleb jätkata sõnaraamatu algkäsikirja vahepeal katkenud koostamist. Seetõttu on sõnaraamatu edaspidise ilmumise graafikuks kavandatud 1, 5 vihikut aastas (senise 2 vihiku asemel), juhul kui ei õnnestu sõnaraamatu koostajate arvu uute töötajate arvel suurendada.

* Eesti keele etümoloogiline sõnaraamat. Aastaks 2007 on kavas välja anda paberkandjal üldkasutatav sõnaraamatu lühivariant ning teha kogu seni kogutud ning märgendatult sisestatud materjal  kättesaadavaks internetis.

* Läänemeresoome keelte atlas. Ühisprojekt Soome ja Karjala uurijatega jõuab 2007. aastaks lõpule, juhul kui teiste osapoolte töös ei teki seisakuid.

* Vadja keele sõnaraamat – aastaks 2007 viiakse lõpule 6-köitelise vadja keele sõnaraamatu väljaandmine.

* Võru murde sõnaraamat. Sihtfinantseeringu perioodil valmib Võru vana murdekeele sõnaraamat.

Uuringu teostajate teadupotentsiaal

Uuringu teostajate teadupotentsiaali võib hinnata igati kõrgeks. Teema põhitäitjate hulgas on mitmeid oma ala tippstpetsialiste ning kogenud uurijaid. Kokku on teemasse kaasatud kaheksa doktorit ja viis magistrikraadiga uurijat.

Uuringu eeldatavad tulemused ja tähtsus Eesti kultuurile

Uuringu konkreetseteks tulemusteks on eelpool loetletud üldteoreetilised artikliseeriad ning rakenduslikud väljundid, mis loovad aluse eesti keele ajaloolise kujunemise edasisele uurimisele. Eesti keele ajaloolise kujunemise selgitamine annab omakorda aluse tänpäeva eesti keele kui Eesti Vabariigi riigikeele arendamisele ja suunamisele.