RIIKLIK SIHTPROGRAMM “EESTI KEEL JA RAHVUSLIK MÄLU”

Eesti murdetekstide korrastamine, digitaliseerimine ja publitseerimine. 2004–2008

Projekt: Eesti murrete sõnaraamat

Projekti juht dr Kristiina Ross

Projekti täitjad:

Jüri Viikbeg, dr

Vilja Oja, dr

Piret Norvik, mag

Evi Juhkam, mag

Mari Kendla

Anu Haak

Inge Käsi

Mari-Epp Tirkkonen

Projektiga seotud abitööjõud

Merike Järvlepp

Esko Oja

Projekt on järjeks samanimelistele 1999-2003 väldanud projektidele.

Suure “Eesti murrete sõnaraamatu” koostamine ja publitseerimine on Eesti Keele Instituudi dialektoloogide tähtsaim ülesanne. Eesti murrete sõnaraamat on kogu eesti murdesõnavara hõlmav akadeemiline sõnaraamat, milles püütakse võimalikult laialdaselt kajastada kõigi eesti murrete sõnavara, nii palju nagu seda on jõutud varasematel aastatel talletada. Sõnaraamatu aluseks on EKI murdesektoris paiknev murdearhiiv, mis sisaldab eesti murrete kohta alates 1920ndatest aastatest kogutud materjale. Sõnaraamatus esitatakse kogu talletatud murdekeelne sõnavara, näidatakse ära sõnade geograafiline levik, peamised häälikulised ja morfoloogilised esinemiskujud, avatakse sõnade tähendused ning illustreeritakse sõna kasutamist lauses ja fraseologismides.

Projekti töökava aastaks 2004:

2004. aastal antakse välja “Eest murrete sõnaraamatu” 15. vihik (toimetajad A. Haak, M. Kendla ja J. Viikberg) ja 16. vihik (toimetajad E. Juhkam ja P. Norvik). Provisoorselt peaks see hõlmama materjali kuni märksõnani käim, ent täpne kahte vihikusse mahtuv materjalihulk selgub pärast küljendamist.

2004. aastaks taotletud 900 000 krooni, eraldatud 500 000 krooni

Eesti (kirja)keele ajaloo alased allikapublikatsioonid, ülevaated ja teatmeteosed. 2004–2008

Projekt: Eesti keele etümoloogiline sõnaraamat

Projekti juht dr Kristiina Ross

Projekti täitjad

Iris Metsmägi, dr

Sven-Erik Soosaar, mag

Meelis Sedrik, mag

Lembit Vaba, dr 

Projektiga seotud abitööjõud

Maeve Leivo 

Sirje Nilbe

Mari-Liis Paaver 

Projekt on jätkuks 2002. aasta programmist “Eesti keele ja rahvuskultuur” ning 2003. a programmist “Keeletehnoloogia ja EKI sõnaraamatud” finantseeritud projektile.

Projekti eesmärgiks on koostada ja välja anda üheköiteline paberverisoonis “Eesti keele etümoloogiline sõnaraamat” ning ühtlasi süstematiseerida ja teha üldsusele Internetis kättesaadavaks seni arvutisse sisestatud materjalid eesti keele sõnade päritolu kohta.

Keele sõnavara päritolu kajastav etümoloogiline sõnaraamat on hädavajalik osis iga kultuurkeele leksikograafilises varamus. Eesti keele kohta niisugune, tänapäeva nõuetele vastav üldkasutatav teatmeteos puudub. On olemas J. Mägiste 12-köiteline “Estnisches etymologisches Wörterbuch”, mis jäi koostaja poolt mustandijärku ning anti hiljem rotaprintpaljundusena välja. Selle raamatu seisukohad on subjektiivsed ja tänapäevaks vananenud; kuna käsikiri jäi autoril viimistlemata, pole materjali esitus järjekindel ega süsteemipärane; sõnaraamatu kasutamist piirab ka asjaolu, et selle põhitekst on saksakeelne. Mägiste sõnaraamatu põhjal on A. Raun koostanud väikese teatmiku, mis on aga äärmiselt pinnapealne. Tänapäevane, võimalikult objektiivne etümoloogiasõnastik peaks hõlmama kogu senist uurimistööd ning erinevate autorite seisukohti, püüdes varasemat üldistada ning pakkudes välja uusimaid lahendusi.

EKI soome-ugri keelte sektoris alustati etümoloogilise materjali kogumist juba 1970. aastate lõpus. Praeguseks on paberversioonis olemas kartoteek, mis sisaldab põhimõtteliselt kõiki läänemeresoome keelte sõnavara etümoloogiat puudutavaid materjale. 80. aastate lõpul alustati materjali sisestamist arvutisse ja selle märgendamist. Praeguseks on materjal sisestatud ja märgendatud, kuid ühtlustamata.

Arvutivariandis on tulevikus kättesaadav põhimõtteliselt igasugune info, mis eesti kirjakeele ja murdesõnade päritolu puudutab, sealhulgas ka rahvaetümoloogiat ning muid ilmselgelt ebateaduslikke või vananenud seisukohti kajastav kirjavara. Kogu selle äärmiselt mahuka ja amorfse materjali põhjal koostatakse kompaktne üheköiteline paberkandjal sõnaraamat, mis sisaldab eesti kirjakeele sõnavara enam-vähem ÕS 1999 ulatuses ja mille igale sõnale esitatakse üks kõige tõenäosem tänapäevane etümologiseerind (või eriti vaidlusalustel juhtudel kaks paralleelvõimalust) ja näited sõna esinemusest sugulaskeeltes või (laenu korral) päritolukeeles. 2002. aastal töötati välja etümoloogiasõnaraamatu koostamise põhimõtted: märksõnade valiku põhimõtted ja sõnaartiklite kavandatav struktuur. 2003. aastal viimistleti sõnaraamatu koostamispõhimõtteid ning alustati tegelikku koostamist. Koostati 500 sõnaartiklit.

Projekti töökava aastaks 2004:

2004. aastal jätkub sõnaraamatu artiklite koostamine. Kavas on (esialgsel kujul) koostada ideaalis 3000 artiklit. See oleks võimalik, kui nädalas koostataks 60 artiklit, ning järelikult teostatav juhul kui kõik kolm tegevkoostajat (I. Metsmägi, S-E. Soosaar ja M. Sedrik) saaksid aasta läbi päev päevalt pühenduda sõnaraamatu koostamisele. Kuivõrd etümoloogiasõnaraamatu töö on põimunud sihtfinantseeritava uurimistööga (ning 3 töörühma kuuluva uurija palk ongi kavandatud sihtfinantseeritavate rahade arvelt), siis tuleb koostajail paratamatult aeg-ajalt täita muidki ülesandeid, mistõttu reaalne aastane tööhulk on oletatavasti 2500 artiklit.

2004. aastaks taotletud 300 000 krooni, eraldatud 200 000 krooni

Tänapäeva eesti keele baassõnastikud. 2004–2008

Projekt: Eesti õigekeelsuse alussõnaraamatud

Projekti juht Tiiu Erelt

Projekti täitjad

Tiina Leemets, mag

Argo Mund 

Sirje Mäearu, mag 

Maire Raadik, mag

Projektiga seotud abitööjõud

Kaja Kruusmaa

Õigekeelsuse sõnaraamatutel (ÕS) on olnud läbi aegade eesti kirjakeele ühtlustamise seisukohalt määrav tähtsus. Need on ilmunud lühemate või pikemate vahemike järel (1918, 1925 – 1937, 1960, 1976, 1999) ning alati pakkunud oma ajas aktuaalseimat sõnavara ning ajakohaseid keelelisi soovitusi. ÕSi sisu tuleb pidevalt uuendada ja täiendada, et kaasas käia toimuvate muutustega. Uuenduste tegemise optimaalne vahemik on praegusel hinnangul iga viie aasta tagant.

ÕS 2005

on ümber töötatud ja täiendatud variant 1999. a ilmunud “Eesti keele sõnaraamatust ÕS 1999”. Muudatustes võetakse arvesse nii uuenenud sõnavara keelekasutust kui ka ÕS 1999 kasutajatelt tulnud märkusi ja ettepanekuid. Korrigeeritakse ÕS 1999 esitust selles osas, mis kasutajatele on valmistanud raskusi. Pärast ÕS 2005 ilmumist kavandatakse järgmist väljaannet juba uuema tehnoloogia võimalusi kasutades (võrguväljaanne, CD jm).

Õpilase ÕS

on mitte lihtsalt suure ÕSi vähendatud ja lihtsustatud variant, vaid emakeeleõppe metoodikat arvestades loodud uue ülesehitusega sõnastik, mida sobib kasutada kooli algastmel ja põhikoolis sissejuhatusena suurele ÕSile. Käsikiri valmis 2003. a lõpuks.

Projekt on järg algselt 2002. aastaks esitatud projektile, mida on seni rahastatud programmi Eesti keele ja rahvuskultuur” alt (2002. a) ja programmi “Keeletehnoloogia ja EKI sõnaraamatud” alt (2003).

Projekti töökava aastaks 2004:

1. “Õpilase ÕSi” ettevalmistamine trükiks (küljendus ja korrektuur).

2. ÕS 2005 paranduste ja täienduste kogumine, keeleprobleemide läbitöötamine, käsikirja parandamine ja täiendamine.

2004. aastaks taotletud 350 000 krooni, eraldatud 200 000 krooni

Tänapäeva eesti keele baassõnastikud. 2004–2008

Projekt: Eesti kirjakeele seletussõnaraamat

Projekti juht mag Margit Langemets

Projekti täitjad

Rudolf Karelson, dr 

Margit Langemets, mag 

Mai Tiits   

Tiia Valdre  

Leidi Veskis    

Piret Voll, mag       

 “Eesti kirjakeele seletussõnaraamat” (EKSS) on Eesti Keele Instituudis koostatav esimene eesti kirjakeele kogu sõnavara kirjeldav sõnaraamat. EKSS kajastab tänapäeva eesti keele leksika põhiosa selle eri kasutusaladel, selle koostamisel toetutakse sõnavarakogudele, senistele eesti keele sõnaraamatutele, muudele sõnavara- ja grammatikakäsitlustele ja uuematele teatmeteostele.

Sõnaraamatu toimetamine ja koostamine (alustatud 1960ndatel) on jõudnud lõppfaasi: ilmunud on A-unelus (23 vihikut). Kokku ilmub 27 vihikut (iga aasta üks) ja koos viimase põhivihikuga (2007. a) ka uute sõnade täiendvihik. Ühe vihiku maht on keskeltläbi 22,5 autoripoognat ehk 12,5 trükipoognat, arvutikesksena umbes 1 MB.

Sõnaartiklid koostatakse tekstinäidiste põhjal, aluseks eesti kirjakeele arhiiv (4,3 mln sõnasedelit) ja eesti keele tekstikorpused (TÜ eesti kirjakeele korpus, EKi tekstikorpus). Sõnastikutekst sisestatakse arvutisse struktureeritud tekstina, igal struktuuriüksusel on oma märgend. Koostamispõhimõtted on aja jooksul veidi muutunud (tsitaatidele eelistatakse lühiväljendeid ja leksikograafide näidislauseid). Juba paar aastat tagasi jõuti tööjärku, kus sõnaraamatu algkäsikiri on puudunud, mistõttu vihikute ilmumistempoks olemasoleva tööjõu juures on stabiliseerunud üks vihik aastas.

Riiklik sihtprogramm “Eesti keel ja rahvuskultuur” on toetanud sõnaraamatu koostamist ja toimetamist aastatel 1999-2002 (eraldis kokku 765 000) kr, 2003. aastal rahastati sõnaraamatu sihtprojektist “Keeletehnoloogia ja EKI sõnaraamatud” (425 000 kr).

Projekti töökava aastaks 2004:

2004. aastal lõpetatakse “Eesti kirjakeele seletussõnaraamatu” VI köite 4. vihiku (unemaa – valdusõigus) toimetamine ja trükiks ettevalmistamine.

Pooles mahus toimetatakse järgmist, VII köite 1. vihikut (ehk 25.  vihikut, vale – vibuõng).

Tegeldakse jätkuvalt sõnaraamatu arvutitöötlusega, kontrollitakse ja korraldatakse sõnaraamatu teksti andmebaasiformaati.

2004. aastaks taotletud 800 000 krooni, eraldatud 500 000 krooni

Tänapäeva eesti keele baassõnastikud. 2004–2008

Projekt: Eesti-vene sõnaraamat

Projekti juht mag Margit Langemets

Projekti täitjad

Tiiu Lagle  

Maimu Liiv  

Jelena Kallas, mag 

Nelli Melts    

Projektiga seotud abitööjõud

Helga Laasi, dr  

Astrid Küüts   

Tiia Valdre   

Ülle Viks, dr 

Eesti keele kui riigikeele õppimist-õpetamist toetavad lisaks vastavatele õpikutele ja muudele õppevahenditele kakskeelsed eesti ja vene keele sõnaraamaatud.

1984-1994 ilmus Eesti Keele Instituudis tehtud 4-köiteline “Vene-eesti sõnaraamat”. Pärast selle valmimist alustati vastupidise, mahuka ja nüüdisaegse eesti-vene sõnaraamatu koostamist ja toimetamist. 2002. a korrigeeritud plaani  järgi tuleb sellest 5-köiteline sõnaraamat, millest seni on ilmunud kolm köidet: 1997 (A – J), 2000 (K – L), 2003 (M-P).

Koostatav sõnaraamat on fundamentaalne sõnaraamat, mis erineb seni ilmunud eesti-vene sõnaraamatutest nii mahu kui ka keeleainese esitusviisi poolest. Sõnaraamatus püütakse ammendavalt kirjeldada mõlemat keelt. Ainulaadne ja eriti oluline on sõnastiku kõikidele eesti märksõnadele automaatselt lisatud hädavajalik grammatiline info, mis aitab eesti sõna õigesti käänata ja pöörata. Sama oluline on vene tõlkevastetele antud põhjalik grammatiline info: põhivormid, sõnaliik, soomärgend, ainsuse-mitmuse kasutamise võimalused jpm. Üksikasjalikult selgitatakse eesti sõnade tähendusi, rohkesti esitatakse kasutusnäiteid ja fraseoloogilisi väljendeid.

IV köide (R-tjah) ilmub (eeldatavasti) 2005.a, V köide (toa-Y) ilmub (eeldatavasti) 2007. aastal.

Projekti töökava aastaks 2004:

IV köitega (R-tjah) seotud tööd:

2004. aastaks taotletud 500 000 krooni, eraldatud 300 000 krooni

Tänapäeva eesti keele baassõnastikud. 2004–2008

Projekt: Eesti-X-keele sõnastik

Projekti juht dr Urmas Sutrop

Projekti täitjad

Piret Voll, mag

Jane Lepasaar

Külli Kuusk  

Katrin Kuusik

Margit Langemets, mag   

Ülle Viks, dr

Merike Mägedi, mag

Projektiga seotud abitööjõud

Andres Loopmann

Eesmärk on koostada ühtne eesti keele alus tulevaste instituudis tehtavate kakskeelsete eesti-X sõnastike jaoks. See sarnaneb paljus ükskeelsele seletussõnastikule, ent lähtub kakskeelse struktuurist ja on palju kompaktsem. Töö käigus valmib universaalse eesti-X sõnastiku põhi (edaspidi EXS), millest hiljem saab teha erinevaid kakskeelseid tulemsõnastikke, aga mida saab kasutada ka uue ükskeelse seletussõnaraamatu alusena.

EXS on:

a) vastete keeles sõltumatu;

b) tulemsõnastiku mahust sõltumatu – iga mahukategooria jaoks oma valikuprintsiibid: märksõnavalik, infovalik (alustada saab ka mingist konkreetsest mahust);

c) elektrooniliselt töödeldav  - kogu info on eksplitsiitselt esitatud korralikult märgendatud (XML-tüüpi) struktuuriüksuste kaupa. EXS kui andmebaas võib sisaldada enam infot kui tulemsõnastikku tegelikult sisse läheb.

EXS toetud EKI akadeemiliste baassõnaraamatute andmestikule ja arvestab uuemaid arenguid sõnavaras, grammatikas ja keelekorralduses. EXS on kõigepealt aluseks uuele eesti-läti sõnaraamatule ja valmib sellega tihedas koostöös.

2003. aastal eraldas riiklik sihtprogramm “Keeletehnoloogia ja EKI sõnaraamatud” projektile 200 000 kr. 2003. a lõpetati märksõnastiku valimine ja koostamine: kokku on EXS andmebaasis 41 075 märksõna, sh 860 ühendit, 514 märksõnavarianti; homonüümseid märksõnu on 647. Koostatud on elektroonilise andmebaasi struktuur ja struktuurikirjeldus. Kogu eesti-X andmebaas on üle viidud XML-Editori.

Projekti töökava aastaks 2004:

1. Alustatakse süntaktilise info lisamist andmebaasi;

2. Alustatakse mitmetähenduslike märksõnade tähendusliigenduse lisamist.

2004. aastaks taotletud 250 000 krooni, eraldatud 200 000 krooni

Keelekorraldus ja oskuskeel. 2004–2008

Projekt: Keelekorraldus

Projekti juht Tiiu Erelt

Projekti täitjad

Tiina Leemets, mag

Sirje Mäearu, mag

Tiina Paet 

Peeter Päll, mag

Maire Raadik, mag

Projektiga seotud abitööjõud

Kaja Kruusmaa

Keelekorralduse eesmärk Eestis on tagada eesti keele kui riigikeele ja ülemaalise suhtluskeele täisväärtuslik funktsioneerimine kõigil elualadel. Selleks on vajalik ajaga kooskõlas hoida keelereeglid, luua uut oskussõnavara, anda nimesoovitusi ja teha heas mõttes keelepropagandat. programmi raames avaldatakse artikleid keelekorralduse aktuaalsetel teemadel.

Käesolev projekt hõlmab keelekorraldust selle kitsamas tähenduses, s.t keele arengu teadlikku suunamist, keelereeglite ja soovituste väljatöötamist (soovitusi annab Emakeele Seltsi keeletoimkond). projekt hõlmab nii üld- ja oskuskeelekorraldust kui ka nimekorraldust. varasematel aastatel on samanimelise projekti alla arvatud ka keelenõu andmine jm, mis kuulub keelehoolde mõistesse. 2004. aastal rahastatakse seda tegevust eeldatavasti eraldi lepinguga Riigikantselei toetusel.

Projekti töökava aastaks 2004:

1. Artiklid keeleteemadel ajakirjades Keel ja kirjandus, Oma Keel ja Õiguskeel.

2. Kogumik “Panganduskeel” (autor Maire Raadik, käsikiri valmib aasta lõpuks).

3. Keelekorraldusprobleemide ettevalmistamine Emakeele Seltsi keeletoimkonnale.

4. Eestis toimuva terminoloogiatöö teaduslik ja metoodiline juhendamine. Kaasatöötamine terminikomisjonides.

5. tegutsemine nimeteadusliku usaldusasutusena: nimekasutuse ekspertiisid ja arvamuste ettevalmistamine kohanimenõukogule (Siseministeeriumi juures), Tallinna nimekomisjonile ning eeldatavale isikunimekomisjonile (pärast isikunimeseaduse vastuvõtmist). Normitud kohanimede andmebaasi edasiarendamine ja täiendamine.

2004. aastaks taotletud 280 000 krooni, eraldatud 150 000 krooni

Rahvusliku krestomaatilise tähtsusega ülevaated, leksikonid, teatmeteosed Eesti kultuuri kohta. 2004–2008

Projekt: Eesti piiblitõlgete leksikaalne ja grammatiline andmebaas.

Projekti juht dr Kristiina Ross

Projekti täitjad

Kristiina Ross, dr

Urmas Sutrop, dr

Projektiga seotud abitööjõud

Astrid Küüts

Johanna Ross       

Inge Käsi

programmeerija

Projekt on jätkuks 2003. aasta riikliku sihtprogrammi “Eesti keele ja rahvuslik kultuur” raames sama nime all funktsioneerinud projektile. Projekti eesmärgiks on koostada 16.-18. sajandi eesti piiblitõlgete leksikaalne ja grammatiline andmebaas.

Kogu eesti kirjakeele areng oli oma esimeses faasis suunatud Piibli väljaandmisele, mis sai teoks 1739. aastal. Seega on Piibli tõlkimisel olnud eesti kirjakeele tekkeloos keskne roll. Selles poolteist sajandit väldanud protsessist on publitseerituna olemas tartumurdeline Wastne Testament (1686), põhjaeestikeelne Uus Testament (1715) ja täispiibel (1739) ning peale selle hajali erinevaid periooditõlkeid kirikukäsiraamatutes. Publitseeritud materjalidele lisaks on arhiivides tallel veel mitmeid käsikirjalisi tõlkeid: 1650ndate aastate lõunaeestikeelne Vana Testamendi tõlge J. Gutslaffilt; 1690ndate  aastate põhjaeestikeelne Vana Testamendi tõlge isa ja poeg Andreas ja Adrian Virginiuselt; 1680ndate aastate Pilistvere piiblikonverentsidel toimetatud Uue Testamendi käsikirjad; põhjaeestikeelse Uue Testamendi Müncheni ja Stockholmi käsikiri; 1739. a täispiibli mustandkäsikirjad jms.

Selleks, et saada ülevaatlikku pilti eesti piiblikeele tegelikust kujunemisloost – aga see tähendab, sisuliselt kogu eesti kirjakeele alusversiooni tekkeloost - , on hädavajalik koondada kogu loetletud materjal ühtsesse andmebaasi, mis võimaldaks jälgida tõlke arengut: a) piiblisalmide kaupa; b) originaali sõnadele pakutud leksikaalsete tõlkevastete kaupa, c) tõlkimisel rakendatud grammatiliste kategooriate kaupa, d) grammatilistele kategooriatele antud vormide kaupa. Selleks tuleb kogu materjal sisestada ja märgendada enam-vähem vastavalt samadele põhimõtetele, mille on välja töötanud TÜ vana kirjakeele töörühm. Koostatava andmebaasi eripära seisneb aga selles, et põhirõhk langeb siin tõlketeksti dünaamikale läbi pooleteise sajandi ning teksti tõlkespetsiifikale. Viimasest tingituna tuleb korpus ühendada nii heebrea ja kreeka kui ka saksa ja ladina piiblikonkordantsidega.

Projekti töökava aastaks 2004:

2004. aastal jätkatakse pooleli olevate tekstide, Virginiuste tõlgitud Vana testamendi käsikirja ja 1739. a täispiibli trükiverisooni sisestamist ning märgendamist. kahe tõlke 1. Moosese raamatu baasil käivitatakse nende tõlkekonkordants ning alustatakse eesti diakroonilise piiblisõnastiku koostamist. Püütakse lahendada tehnoloogilised probleemid käsil oleva andmebaasi ja Internetis leiduva heebrea, kreeka, ladina ning saksa konkordantside sidumiseks.

2004. aastaks taotletud 350 000 krooni, eraldatud 100 000 krooni

Keeletehnoloogia. 2004

Projekt: Eesti keele sõnastikud Internetis

Projekti juht dr Ülle Viks

Projekti täitjad

Ülle Viks, dr

Indrek Hein 

Margit Langemets, mag 

Projektiga seotud abitööjõud

Indrek Kiissel  

Andres Loopmann

lepingulised

Projekti eesmärk on teha laiale avalikkusele Interneti kaudu kättesaadavaks Eesti Keele instituudis valminud ja valmivad sõnastikud, mis toetuvad teaduslikule uurimistööle ning sisaldavad kvaliteetset ja ajakohast teavet eesti keele kohta.

Pabersõnastiku kasutamisvõimalused on piiratud: sealt saab infot otsida ainult märksõna kaudu. Elektrooniline verisoon loob täiesti uusi kasutusvõimalusi, nt otsing eri tunnuste järgi ja mitmest sõnastikust korraga, liikumine tekstist sõnastikku ja vastupidi jne. Interneti vahendusel on sõnastikud kättesaadavad väga suurele auditooriumile, kusjuures erinevatele huvigruppidele (lihtlugejad, õppurid, tõlkijad, keeleteadlased jne) saab luua ka erinevad päringuvõimalused.

Plahvatuslikult suurenenud arvutikasutus on muutunud ohtlikuks rahvuskeele säilimisele. Inglise keele sissetungi ei saa peatada manitsustega. Ainus võimalus on luua vastukaal sellessamas keskkonnas – Internetis. Selleks tuleb teha eesti keele teatmematerjalid (sõnastikud, käsiraamatud jms) mugavalt kättesaadavaks igale arvutikasutajale (koolilapsele, professorile, poliitikule, ärimehele jne) ning hoolitseda selle eest, et esitatu oleks parimal võimalikul tasemel.

Internetis olevad sõnastikud ja nendega seotud mitmekesised päringuvariandid loovad uued võimalused eesti keele õppimiseks ja õpetamiseks kõigil keeleõppe tasanditel: põhikoolist doktoriõppeni, nii emakeelena kui võõrkeelena.

EKI sõnastike sattumine Internetti on varem olnud juhuslik. Neid võib leida EKI enda koduleheküljelt http://www.eki.ee/dict/, aga neid on välja pannud ka teised organisatsioonid: Balti Uuringute Instituut http://dict.ibs.ee/syn ,firmad ASE Computers http://www.ase.ee/dict/ ja Festart http://www.festart.ee/est/demos.html ning eelkõige projekt KeeleWeb, mis sai 2. preemia andmebaaside konkursil 1999 http://ee.www.ee

Käesoleva projekti käigus koondatakse senised sõnastikud ühtsesse süsteemi, lisatakse uusi sõnastikke ning luuakse sobiv kasutajaliides, mis arvestab erinevate huvigruppidega ja võimaldab päringuid eri tasemetel. Lähipäring on mõeldud tavakasutajale, kes otsib mingi üksiksõna tähendust või käänamist või tõlkevastet jms. Komplekspäring on nõudlikumale kasutajale, kes vajab keelematerjali uurimistööks või uue sõnastiku koostamiseks või õppekursuse ettevalmistamiseks jne. Komplekspäring eeldab sõnastiku formaliseerimist ja sõnaartikli osade varustamist struktuurimärgenditega.

Projekti töökava aastaks 2004:

Käesoleva aasta ülesanded ons eotud keeletehnoloogia alamprogrammi osaga “Leksikaalsed ja grammatilised ressursid” (punkt 7: sõnastike standardiseerimine) ja “tarkvara rakendusalad” (punkt 9: elektrooniliste sõnastike koostamise vahendid).

1. Sõnastike standardiseerimine: ühtlustada ja üle viia ühtsele XML-standardile Eesti keele seletussõnaraamatu ja Eesti-vene sõnaraamatu märgendussüsteemid.

2. Eesti keele sõnaraamatud: ette valmistada ja Internetti välja panna Eesti keele seletussõnaraamat olemasolevas mahus.

3. Kakskeelsed sõnastikud: teha veebiversioon Soome-eesti suursõnaraamatust (I-II Tallinn 2003); jätkata tööd kakskeelsete sõnastike päringusüsteemiga.

4. Ristviited: luua ristviidete süsteem eri sõnastike vahel: Vene-eesti ja Soome-eesti sõnaraamatu vastetelt Õigekeelsussõnastiku sõnaartiklitesse.

5. Sõnastike kasutajaliides: luua veebisõnastike keskkonna (KeeleWeb) uus versioon: uus sisuline liigendus, sisearhitektuur, päringusüsteem jne.

2004. aastaks taotletud 400 000 krooni, eraldatud 220 000 krooni