LINGUAE avaleht | Päringuvorm | Keelte loend | Andmebaasi ülevaade | Uuendused

Linguae: maailma keeled, kirjad ja rahvad

Andmebaasi ülevaade

NB! Alates 27. oktoobrist 2022 kolib Linguae järk-järgult üle Sõnaveebi (andmebaas) ja EKI teatmikku (selgitused ja süstemaatiline register). Kõik parandused ja täiendused tehakse uues andmebaasis. Vana andmebaas on senisel aadressil alles ja jääb kättesaadavaks kuni andmete täieliku ülekandmiseni. Soovitatav on infot vaadata esmajärjekorras teatmiku süstemaatilisest registrist (või Sõnaveebist, kui huvitavad muukeelsed vasted), seejärel vanast andmebaasist.

Vt andmebaasi ülevaadet EKI teatmikus

Andmebaasi sisu

Andmebaasi on võetud kõik keelte nimetused, mis esinevad vähemalt ühes järgmistest allikatest: 1) Paul Ariste "Maailma keeled" (I, 1967; II, 1969; 2. trükk 1972); 2) "Eesti nõukogude entsüklopeedia" (1968-1978) ja "ENE/Eesti entsüklopeedia" (1985-1999) maailmajagude keelekaardid; 3) Emakeele Seltsi keeletoimkonna soovitatud keelte ja rahvaste nimetused (1998, sisaldab peaaegu kõiki standardites ISO 639-1 ja 639-2 mainitud keeli). Kui varasemaid keelenimetusi ei ole olnud võimalik üheselt seostada praegu tuntud keelte nimetustega, on vanemad variandid varustatud märgendiga "küsitav". Mõnel juhul on nüüdisvariant jäänud üldse kindlaks tegemata, sel juhul on viide kirje tekstis.

Primaarne on andmebaasis keelenimetus, vastav rahvanimetus (etnonüüm) lisatakse, kui see on keelenimetusega seostatav. Etnonüümil antakse tavaliselt ainsuse kuju, millele lisatakse koma järel mitmuse kuju (kui see erineb üksnes mitmuse lõpu poolest, võib lisada selle sidekriipsuga):
l`akk, l´akid
lad`iin, lad´iinid
ar`aablane, -lased
k´ikuju, -d

(Nimetustesse lisatud vahemärgid näitavad väldet ja palatalisatsiooni nii nagu "Maailma kohanimede" sõnastikus: ´ märgib I- ja II-vältelist rõhusilpi, ` III-vältelist rõhusilpi; märk paikneb alati rõhulise täishääliku eel. Väike üla-j märgib peenendust e palatalisatsiooni, alakonks ˛ aga silbipiiri.)

Keeled või murded?

Põhiliselt on joondutud ISO 639 standardis antud määratlustest, mida kajastavad nt Ethnologue'i andmebaas ja Linguist List. Seejuures on ära kasutatud ISO 639-3s pakutud nn makrokeele mõistet: kui mingi rahvas peab ennast üheks ja kasutab oma keele tähistamiseks kindlat nimetust, ent lingvistiliselt on tegu eri keeltega, siis on ISO standardis seda nimetatud makrokeeleks. Nii on kurdi keele puhul tegemist ühtse identiteediga, mida kajastab kurdi makrokeel, ent lingvistiliselt on tegu vähemalt kolme keelega (põhjakurdi e kurmandži, keskkurdi e sorani ja lõunakurdi). Kui makrokeele kontseptsioon toodi algul käibele ISO standardite ISO 639-1, 639-2 ja 639-3 kokkusobitamiseks (esimesed kaks osa käsitasid keeltena mõnevõrra laiemaid kooslusi), siis siinses andmebaasis on seda laiendatud ka nendele keeltele, mis ISO 639-1s ega 639-2s ei esine, ent moodustavad siiski ühtse identiteedi (ISO 639-3 on seevastu neid killustanud mitmeks kõneldavaks keeleks). Andmebaasis märgib makrokeeli kood lg10, neis sisalduvaid kõneldavaid keeli lg0.

Kuivõrd osa eespool nimetatud allikates mainitud keeli liigituvad tänapäeval murreteks, siis on ka need andmebaasis antud. Murrete põhjalikumat esitust ei ole siiski siinsest andmebaasist põhjust eeldada. Lisatud on üksnes meie lähimate naaberkeelte murdeid.

Keelte liigitus keelkondadesse

Aluseks on peamiselt võetud ENE-EE keelekaartidel antud liigitused, ent arvestatud on ka uuemaid käsitlusi (sh Ethnologue ja Linguist List). Ameerika indiaani keelte puhul on antud hüpoteetilised hõimkonnad ja suurhõimkonnad, kuigi valdav osa nüüdiskäsitlusi neid ei järgi. Keelte liigitusega seotut on vahel kommenteeritud täiskirjes.

Andmebaasi peaeesmärk on kokku viia eri nimekujud, mida keelte, rahvaste, keelerühmade jne tähistamiseks tarvitatakse, ja valida neist välja keeleliselt soovitatavad. Baasis kajastuvaid liigitusi keelteks ja murreteks, keelkondadeks jm-ks ei saa pidada lõplikeks, kasutajale jääb alati võimalus neid omatahtsi sobitada. Kui näiteks baasis on karjala, livviko ja lüüdi keel, siis ei tähenda see muud kui et ISO standardis on neile keelekujudele antud oma koodid, see ei välista näiteks karjala keelest ja selle Aunuse ja lüüdi murretest kirjutamist. Keelerühmade nimetuste puhul on tarvis silmas pidada, et kuigi paljud nimetused on sünonüümsed, on neile eri autorid andnud ka eri tähendusi (vt nt märkust Nigeri-Kordofani keelte all).

Nimetuste valik ja vormistus

Keeli ja rahvaid on nimetatud mitmeti. Mitmeid traditsioonilisi nimetusi peavad vastava keele kõnelejad ise mõnikord halvustavateks. Sel juhul on ka eesti keeles püütud senine nimetus asendada uuemaga, mis lähtub tavaliselt rahva endanimetusest. Mõned näited muudatustest: auka > vaorani, birale > ongota, galla > oromo. Piiritlemine on siiski keeruline, näiteks ei pea eesti õigekeelsusallikad mustlast ega laplast halvustavaks, kuigi inglise tavas eelistatakse nende puhul omakeelseid nimetusi.

Standardi ISO 639-3 aluseks on Ethnologue'i andmebaasis kasutatavad nimetused. Erinevalt standardi teistest osadest (ISO 639-1 ja -2) püüab Ethnologue keeli liigitada nö objektiivsete kriteeriumide alusel, kasutades mõistetavuse printsiipi: kui kahe keelekuju kõnelejad saavad teineteisest piisavalt hästi aru, on tegemist sama keele murretega, kui ei, siis eri keeltega (vt selle kohta lähemalt ISO 639-3 määratluste lehelt). Selle tulemuseks on paljude keelte killustamine mitmeteks keelekujudeks ja neile täiesti tinglike nimetuste andmine, milles eristava täiendina kasutatakse kas kohanimesid või ilmakaari. Vastava keele kõnelejad ise ei pruugi niisugustest nimetustest teadlikudki olla ja loevad end tavaliselt suurema koosluse osaks (need on sel juhul makrokeeled, vt eespoolt). Siinses andmebaasis on niisuguseid keelenimetusi sisse võetud enamasti paratamatusest, sest keelekood on antud just neile, mitte laiemale kooslusele, makrokeelele. Loobutud on Ethnologue'i täpsustavatest täienditest juhul, kui valdavalt tuntakse eri keelekujudest vaid üht: andmebaasis on khmeeri keel (mitte "keskkhmeeri keel" – vrd Ethnologue'is on ka põhjakhmeeri keel), altai keel (mitte "lõunaaltai keel", Ethnologue eristab sellest põhjaaltai keelt) jne. (Mõnel juhul on näiteks kohanimeandmebaasi rakendustes üldisem keelekood hakanud tähistama kitsamat keelekuju: chm tähistab niidumari keelt, kuigi Ethnologue'is on "chm" mari makrokeel, mis koosneb niidumari (mhr) ja mäemari (mrj) keelest, samuti on mn Mongoolia mongoli (halhimongoli) keele tähis, kuigi Ethnologue'is on see jälle makrokeel, mis koosneb halhimongoli (khk) ja nn ääremongoli (sisemongoli, mvf) keelest.)

Murrete nimetamisel on püütud järgida ühtset malli: kui murdenimetus tuleneb kohanimest või hõimunimetusest, siis keele enda nimetust ei ole lisatud, kui see aga sisaldab näiteks ilmakaart märkivat vm kirjeldavat sõna (kesk-, ülem- jts), siis on ette lisatud keelenimetus: mansi idamurded, mansi läänemurded, mari loodemurre jne. See tähendab, et tavakasutuses võib keelenimetus ka puududa (kui keele kontekst on selge), nt idamurded, läänemurded, loodemurre jne. Samahästi võib täiendi teinekord lisada ka keelenimetuse ette: idamansi murded, läänemansi murded, loodemari murre jne. Et kõiki niisuguseid vorme andmebaasis pole, on üksnes seetõttu, et selline vaheldamine on täiesti reeglipärane.

Nimetuste mugandamine ja sobitamine

Lähtutud on Emakeele Seltsi keeletoimkonna 1998. a soovitusest, mille järgi kirjutatakse keelte, rahvaste ja hõimude nimetused häälduspärasel kujul. Seejuures ei oleks viga kasutada nimetusi ka algupärasel kirjakujul, sarnaselt tsitaatsõnadele, st muust tekstist eristatult. Nõnda sobivad võrdselt nii sgoo keel (üks kareni keeli) kui ka sgaw' keel, anindiljakva keel (Austraalia keeli) ja anindilyakwa keel, hoo keel (khoisani keeli) ja !xóõ keel.

Andmebaasis on püütud võimalikult paljudele keelenimetustele pakkuda mugandatud nimetusi, ent kasutaja võib soovi korral muidugi piirduda algupärase kirjakujuga. Seejuures maksab siiski tähele panna asjaolu, et keelenimetuste rahvusvahelisel standardimisel ei ole leebelt öeldes kaugele jõutud ja keelenimetuste kirjapildis valitseb sageli üsna piisav segadus. Piisab, kui võrrelda keelenimetuste kirjaviisi Ethnologue'is ja näiteks Wikipedias.

Nimetuste häälikulisel mugandamisel on püütud arvestada eesti võõrsõnades väljakujunenud kirjaviisi. Püütud on vältida täishäälikute meelevaldset pikendamist, näitamaks nime rõhku (nt mitte "tukaano" /hisp Tucano/, vaid tukano; mitte "trioo" /portugali Trió/, vaid trio; mitte "mašakalii" /portugali Maxakalí/, vaid mašakali). Samas, kui lähtekeeles on selgelt pikk täishäälik, siis see on säilitatud, kui paikneb rõhulises silbis (baraamu, datooga, eboo). Rõhk nimetustes on enamasti näidatud esisilbil, kui lähemad andmed lähtekeelse häälduse kohta puuduvad, või kaugemal sõnas, kui seda eeldab silbistruktuur (mask`oi keel, mitte m´askoi või m`ask`oi).

Ühesilbiliste nimetuste mugandamisel on peetud silmas senist tava: kui silbis ühtegi häälikut pikendada ei ole loomulik, siis lisatakse nimetuse lõppu nimetavas käändes i-lõpuline lisasilp, et nimetust oleks ladus kasutada. Nt mitte "šann" (sellest tuleneks "šanni keel"), vaid šani (rahvaliikmenimetuse ainsuse nimetav) ja šani keel.

Kuigi mugandamisel on püütud järgida kindlaid malle, on see siiski vahel paratamatult ebajärjekindel, kuna kinnistunud mugandeid pole tahetud muuta. Nii on eesti keeles traditsiooniliselt (ilmselt varasema saksa häälduse eeskujul) maoori keel (ootuspärane mugand võiks olla "maaori keel", vrd Māori) ja masai keel (mitte "maasai keel"). Kahtluste korral sobiva häälduse osas on püütud valida pigem kirjapildilähedane variant.

Paljud lähtenimetused sisaldavad grammatilisi tunnuseid (ees- või järelliiteid), mis teeb nende otsemugandamise eesti keelde keeruliseks. Senisest tavast lähtudes on, kui võimalik, aluseks võetud lähtenime nominatiiv ja see pandud eesti omastava vormi. Nii on adjektiivse keelenimetuse Wymysiöeryś (saksa Wilmesaurisch, ingl Vilamovian või Wilamowicean) mugandamisel aluseks võetud asulanimi Wymysoj ja saadud vimisoi keel. Prantsuse murre poitevin on taandatud kohanimele Poitou ja saadud Poitou murre. Ingl Omotic languages on tõlgitud Omo keelteks (mitte "omootilisteks keelteks" vms), sest lähteks on Omo jõe nimi. Jne. Kindlasti on siin aga andmete puudumisel veel palju ebajärjekindlust.

Algustäht nimetustes

Emakeele Seltsi keeletoimkonna soovitus näeb ette kirjutada keelte nimetused üldjuhul väikese tähega. Sellest on ka kinni peetud, v.a mõned vähesed erandid, kui keelte nimetamisel on selgelt aluseks võetud mingi kohanimi, nt Coeur d'Alene'i keel (nimetatud reservaadi järgi).

Seevastu murrete ja keelerühmituste nimetamisel tuleb kasutada suurt algustähte, kui aluseks on kohanimi: Altai keelkond, Uurali keelkond, soome keele Peräpohjola murded. Sageli ei ole aga võimalik olnud kindlaks teha, kas on liigitatud kohanimede või hõimunimetuste alusel, seepärast on võimalik, et andmete täpsustamisel nimetuste kirjapilt muutub. Keelerühmituste puhul on püütud suure algustähe põhimõtet võimalikult järjekindlalt rakendada. Mh on lähtutud arusaamast, et ka mõningad harjumuspärased keelkondade nimetused on õieti kohanimed – nö lingvistilised kohanimed –, ja seega saab neid kirjutada suure algustähega: Indoeuroopa (= India + Euroopa), Afroaasia (Aafrika + Aasia), Austroaasia (= austro- 'lõuna' + Aasia). Paraku toob järjekindel lähenemine teisal kaasa ootamatuid kombinatsioone, nt nahhi-Dagestani keelkond (esimene pool nimetuses viitab nahhi e tšetšeeni-inguši hõimudele, teine pool kohanimele Dagestan) või Kesk-Iraani keeled (kesk- on siin ajalises mõttes, st keskperioodi Iraani keeled, samas vrd nt Vana-Kreeka). Teisal sunnib järjekindlus lahku kirjutama seni harjumuspäraseid ühendeid, vrd traditsiooniline obiugri keeled ja uue reegli kohane Obi ugri keeled. Ilmselt on paratamatu, et mõneks ajaks jäävad vähemasti paljud neist rööpselt kasutusele.

PP, 17.11.2009.

Peamised allikad:


© Eesti Keele Instituut, 2009–

Tagasiside: Peeter Päll