LINGUAE avaleht | Päringuvorm | Keelte loend | Andmebaasi ülevaade | Uuendused

Linguae: maailma keeled, kirjad ja rahvad

Andmebaasi ülevaade

NB! Alates 27. oktoobrist 2022 kolib Linguae järk-järgult üle Sõnaveebi (andmebaas) ja EKI teatmikku (selgitused ja süstemaatiline register). Kõik parandused ja täiendused tehakse uues andmebaasis. Vana andmebaas on senisel aadressil alles ja jääb kättesaadavaks kuni andmete täieliku ülekandmiseni. Soovitatav on infot vaadata esmajärjekorras teatmiku süstemaatilisest registrist (või Sõnaveebist, kui huvitavad muukeelsed vasted), seejärel vanast andmebaasist.

Vt andmebaasi ülevaadet EKI teatmikus

Andmebaasi sisu

Andmebaasi on võetud kõik keelte nimetused, mis esinevad vähemalt ühes järgmistest allikatest: 1) Paul Ariste "Maailma keeled" (I, 1967; II, 1969; 2. trükk 1972); 2) "Eesti nõukogude entsüklopeedia" (1968-1978) ja "ENE/Eesti entsüklopeedia" (1985-1999) maailmajagude keelekaardid; 3) Emakeele Seltsi keeletoimkonna soovitatud keelte ja rahvaste nimetused (1998, sisaldab peaaegu kõiki standardites ISO 639-1 ja 639-2 mainitud keeli). Kui varasemaid keelenimetusi ei ole olnud võimalik üheselt seostada praegu tuntud keelte nimetustega, on vanemad variandid varustatud märgendiga "küsitav". Mõnel juhul on nüüdisvariant jäänud üldse kindlaks tegemata, sel juhul on viide kirje tekstis.

Primaarne on andmebaasis keelenimetus, vastav rahvanimetus (etnonüüm) lisatakse, kui see on keelenimetusega seostatav. Etnonüümil antakse tavaliselt ainsuse kuju, millele lisatakse koma järel mitmuse kuju (kui see erineb üksnes mitmuse lõpu poolest, võib lisada selle sidekriipsuga):
l`akk, l´akid
lad`iin, lad´iinid
ar`aablane, -lased
k´ikuju, -d

(Nimetustesse lisatud vahemärgid näitavad väldet ja palatalisatsiooni nii nagu "Maailma kohanimede" sõnastikus: ´ märgib I- ja II-vältelist rõhusilpi, ` III-vältelist rõhusilpi; märk paikneb alati rõhulise täishääliku eel. Väike üla-^j märgib peenendust e palatalisatsiooni, alakonks ˛ aga silbipiiri.)

Keeled või murded?

Põhiliselt on joondutud ISO 639 standardis antud määratlustest, mida kajastavad nt Ethnologue'i andmebaas ja Linguist List. Seejuures on ära kasutatud ISO 639-3s pakutud nn makrokeele mõistet: kui mingi rahvas peab ennast üheks ja kasutab oma keele tähistamiseks kindlat nimetust, ent lingvistiliselt on tegu eri keeltega, siis on ISO standardis seda nimetatud makrokeeleks. Nii on kurdi keele puhul tegemist ühtse identiteediga, mida kajastab kurdi makrokeel, ent lingvistiliselt on tegu vähemalt kolme keelega (põhjakurdi e kurmandži, keskkurdi e sorani ja lõunakurdi). Kui makrokeele kontseptsioon toodi algul käibele ISO standardite ISO 639-1, 639-2 ja 639-3 kokkusobitamiseks (esimesed kaks osa käsitasid keeltena mõnevõrra laiemaid kooslusi), siis siinses andmebaasis on seda laiendatud ka nendele keeltele, mis ISO 639-1s ega 639-2s ei esine, ent moodustavad siiski ühtse identiteedi (ISO 639-3 on seevastu neid killustanud mitmeks kõneldavaks keeleks). Andmebaasis märgib makrokeeli kood lg10, neis sisalduvaid kõneldavaid keeli lg0.

Kuivõrd osa eespool nimetatud allikates mainitud keeli liigituvad tänapäeval murreteks, siis on ka need andmebaasis antud. Murrete põhjalikumat esitust ei ole siiski siinsest andmebaasist põhjust eeldada. Lisatud on üksnes meie lähimate naaberkeelte murdeid.

Keelte liigitus keelkondadesse

Aluseks on peamiselt võetud ENE-EE keelekaartidel antud liigitused, ent arvestatud on ka uuemaid käsitlusi (sh Ethnologue ja Linguist List). Ameerika indiaani keelte puhul on antud hüpoteetilised hõimkonnad ja suurhõimkonnad, kuigi valdav osa nüüdiskäsitlusi neid ei järgi. Keelte liigitusega seotut on vahel kommenteeritud täiskirjes.

Andmebaasi peaeesmärk on kokku viia eri nimekujud, mida keelte, rahvaste, keelerühmade jne tähistamiseks tarvitatakse, ja valida neist välja keeleliselt soovitatavad. Baasis kajastuvaid liigitusi keelteks ja murreteks, keelkondadeks jm-ks ei saa pidada lõplikeks, kasutajale jääb alati võimalus neid omatahtsi sobitada. Kui näiteks baasis on karjala, livviko ja lüüdi keel, siis ei tähenda see muud kui et ISO standardis on neile keelekujudele antud oma koodid, see ei välista näiteks karjala keelest ja selle Aunuse ja lüüdi murretest kirjutamist. Keelerühmade nimetuste puhul on tarvis silmas pidada, et kuigi paljud nimetused on sünonüümsed, on neile eri autorid andnud ka eri tähendusi (vt nt märkust Nigeri-Kordofani keelte all).

Nimetuste valik ja vormistus

Keeli ja rahvaid on nimetatud mitmeti. Mitmeid traditsioonilisi nimetusi peavad vastava keele kõnelejad ise mõnikord halvustavateks. Sel juhul on ka eesti keeles püütud senine nimetus asendada uuemaga, mis lähtub tavaliselt rahva endanimetusest. Mõned näited muudatustest: auka > vaorani, birale > ongota, galla > oromo. Piiritlemine on siiski keeruline, näiteks ei pea eesti õigekeelsusallikad mustlast ega laplast halvustavaks, kuigi inglise tavas eelistatakse nende puhul omakeelseid nimetusi.

Standardi ISO 639-3 aluseks on Ethnologue'i andmebaasis kasutatavad nimetused. Erinevalt standardi teistest osadest (ISO 639-1 ja -2) püüab Ethnologue keeli liigitada nö objektiivsete kriteeriumide alusel, kasutades mõistetavuse printsiipi: kui kahe keelekuju kõnelejad saavad teineteisest piisavalt hästi aru, on tegemist sama keele murretega, kui ei, siis eri keeltega (vt selle kohta lähemalt ISO 639-3 määratluste lehelt). Selle tulemuseks on paljude keelte killustamine mitmeteks keelekujudeks ja neile täiesti tinglike nimetuste andmine, milles eristava täiendina kasutatakse kas kohanimesid või ilmakaari. Vastava keele kõnelejad ise ei pruugi niisugustest nimetustest teadlikudki olla ja loevad end tavaliselt suurema koosluse osaks (need on sel juhul makrokeeled, vt eespoolt). Siinses andmebaasis on niisuguseid keelenimetusi sisse võetud enamasti paratamatusest, sest keelekood on antud just neile, mitte laiemale kooslusele, makrokeelele. Loobutud on Ethnologue'i täpsustavatest täienditest juhul, kui valdavalt tuntakse eri keelekujudest vaid üht: andmebaasis on khmeeri keel (mitte "keskkhmeeri keel" – vrd Ethnologue'is on ka põhjakhmeeri keel), altai keel (mitte "lõunaaltai keel", Ethnologue eristab sellest põhjaaltai keelt) jne. (Mõnel juhul on näiteks kohanimeandmebaasi rakendustes üldisem keelekood hakanud tähistama kitsamat keelekuju: chm tähistab niidumari keelt, kuigi Ethnologue'is on "chm" mari makrokeel, mis koosneb niidumari (mhr) ja mäemari (mrj) keelest, samuti on mn Mongoolia mongoli (halhimongoli) keele tähis, kuigi Ethnologue'is on see jälle makrokeel, mis koosneb halhimongoli (khk) ja nn ääremongoli (sisemongoli, mvf) keelest.)

Murrete nimetamisel on püütud järgida ühtset malli: kui murdenimetus tuleneb kohanimest või hõimunimetusest, siis keele enda nimetust ei ole lisatud, kui see aga sisaldab näiteks ilmakaart märkivat vm kirjeldavat sõna (kesk-, ülem- jts), siis on ette lisatud keelenimetus: mansi idamurded, mansi läänemurded, mari loodemurre jne. See tähendab, et tavakasutuses võib keelenimetus ka puududa (kui keele kontekst on selge), nt idamurded, läänemurded, loodemurre jne. Samahästi võib täiendi teinekord lisada ka keelenimetuse ette: idamansi murded, läänemansi murded, loodemari murre jne. Et kõiki niisuguseid vorme andmebaasis pole, on üksnes seetõttu, et selline vaheldamine on täiesti reeglipärane.

Nimetuste mugandamine ja sobitamine

Lähtutud on Emakeele Seltsi keeletoimkonna 1998. a soovitusest, mille järgi kirjutatakse keelte, rahvaste ja hõimude nimetused häälduspärasel kujul. Seejuures ei oleks viga kasutada nimetusi ka algupärasel kirjakujul, sarnaselt tsitaatsõnadele, st muust tekstist eristatult. Nõnda sobivad võrdselt nii sgoo keel (üks kareni keeli) kui ka sgaw' keel, anindiljakva keel (Austraalia keeli) ja anindilyakwa keel, hoo keel (khoisani keeli) ja !xóõ keel.

Andmebaasis on püütud võimalikult paljudele keelenimetustele pakkuda mugandatud nimetusi, ent kasutaja võib soovi korral muidugi piirduda algupärase kirjakujuga. Seejuures maksab siiski tähele panna asjaolu, et keelenimetuste rahvusvahelisel standardimisel ei ole leebelt öeldes kaugele jõutud ja keelenimetuste kirjapildis valitseb sageli üsna piisav segadus. Piisab, kui võrrelda keelenimetuste kirjaviisi Ethnologue'is ja näiteks Wikipedias.

Nimetuste häälikulisel mugandamisel on püütud arvestada eesti võõrsõnades väljakujunenud kirjaviisi. Püütud on vältida täishäälikute meelevaldset pikendamist, näitamaks nime rõhku (nt mitte "tukaano" /hisp Tucano/, vaid tukano; mitte "trioo" /portugali Trió/, vaid trio; mitte "mašakalii" /portugali Maxakalí/, vaid mašakali). Samas, kui lähtekeeles on selgelt pikk täishäälik, siis see on säilitatud, kui paikneb rõhulises silbis (baraamu, datooga, eboo). Rõhk nimetustes on enamasti näidatud esisilbil, kui lähemad andmed lähtekeelse häälduse kohta puuduvad, või kaugemal sõnas, kui seda eeldab silbistruktuur (mask`oi keel, mitte m´askoi või m`ask`oi).

Ühesilbiliste nimetuste mugandamisel on peetud silmas senist tava: kui silbis ühtegi häälikut pikendada ei ole loomulik, siis lisatakse nimetuse lõppu nimetavas käändes i-lõpuline lisasilp, et nimetust oleks ladus kasutada. Nt mitte "šann" (sellest tuleneks "šanni keel"), vaid šani (rahvaliikmenimetuse ainsuse nimetav) ja šani keel.

Kuigi mugandamisel on püütud järgida kindlaid malle, on see siiski vahel paratamatult ebajärjekindel, kuna kinnistunud mugandeid pole tahetud muuta. Nii on eesti keeles traditsiooniliselt (ilmselt varasema saksa häälduse eeskujul) maoori keel (ootuspärane mugand võiks olla "maaori keel", vrd Māori) ja masai keel (mitte "maasai keel"). Kahtluste korral sobiva häälduse osas on püütud valida pigem kirjapildilähedane variant.

Paljud lähtenimetused sisaldavad grammatilisi tunnuseid (ees- või järelliiteid), mis teeb nende otsemugandamise eesti keelde keeruliseks. Senisest tavast lähtudes on, kui võimalik, aluseks võetud lähtenime nominatiiv ja see pandud eesti omastava vormi. Nii on adjektiivse keelenimetuse Wymysiöeryś (saksa Wilmesaurisch, ingl Vilamovian või Wilamowicean) mugandamisel aluseks võetud asulanimi Wymysoj ja saadud vimisoi keel. Prantsuse murre poitevin on taandatud kohanimele Poitou ja saadud Poitou murre. Ingl Omotic languages on tõlgitud Omo keelteks (mitte "omootilisteks keelteks" vms), sest lähteks on Omo jõe nimi. Jne. Kindlasti on siin aga andmete puudumisel veel palju ebajärjekindlust.

Algustäht nimetustes

Emakeele Seltsi keeletoimkonna soovitus näeb ette kirjutada keelte nimetused üldjuhul väikese tähega. Sellest on ka kinni peetud, v.a mõned vähesed erandid, kui keelte nimetamisel on selgelt aluseks võetud mingi kohanimi, nt Coeur d'Alene'i keel (nimetatud reservaadi järgi).

Seevastu murrete ja keelerühmituste nimetamisel tuleb kasutada suurt algustähte, kui aluseks on kohanimi: Altai keelkond, Uurali keelkond, soome keele Peräpohjola murded. Sageli ei ole aga võimalik olnud kindlaks teha, kas on liigitatud kohanimede või hõimunimetuste alusel, seepärast on võimalik, et andmete täpsustamisel nimetuste kirjapilt muutub. Keelerühmituste puhul on püütud suure algustähe põhimõtet võimalikult järjekindlalt rakendada. Mh on lähtutud arusaamast, et ka mõningad harjumuspärased keelkondade nimetused on õieti kohanimed – nö lingvistilised kohanimed –, ja seega saab neid kirjutada suure algustähega: Indoeuroopa (= India + Euroopa), Afroaasia (Aafrika + Aasia), Austroaasia (= austro- 'lõuna' + Aasia). Paraku toob järjekindel lähenemine teisal kaasa ootamatuid kombinatsioone, nt nahhi-Dagestani keelkond (esimene pool nimetuses viitab nahhi e tšetšeeni-inguši hõimudele, teine pool kohanimele Dagestan) või Kesk-Iraani keeled (kesk- on siin ajalises mõttes, st keskperioodi Iraani keeled, samas vrd nt Vana-Kreeka). Teisal sunnib järjekindlus lahku kirjutama seni harjumuspäraseid ühendeid, vrd traditsiooniline obiugri keeled ja uue reegli kohane Obi ugri keeled. Ilmselt on paratamatu, et mõneks ajaks jäävad vähemasti paljud neist rööpselt kasutusele.

PP, 17.11.2009.

Peamised allikad:

Anhava1998 = Jaakko Anhava. Maailman kielet ja kielikunnat. Gaudeamus, Tampere 1998
Ariste1967 = P. Ariste. Maailma keeled. I. Euroopa ja Aasia keeled. Õpik Ajaloo-Keeleteaduskonna keeleosakondade üliõpilastele. Tartu 1967
Ariste1969 = P. Ariste. Maailma keeled. II. Aafrika keeled. Õpik Ajaloo-Keeleteaduskonna keeleosakondade üliõpilastele. Tartu 1969
Ariste1972 – P. Ariste. Maailma keeled. I. Euroopa, Aasia ja Aafrika keeled. Õpik Ajaloo-Keeleteaduskonna keeleosakondade üliõpilastele. Tartu 1972
Coulmas1991 = Florian Coulmas. The Writing Systems of the World. Blackwell Publishers. (C) 1989, 1991 (reprinted 1997)
Coulmas1999 = Florian Coulmas. The Blackwell Encyclopedia of Writing Systems. Blackwell Publishing. (C) 1996, 1999. (4 print 2006)
ESKT:1998 = Rahvaste ja keelte nimetuste õigekiri. Emakeele Seltsi keeletoimkonna soovitus. – Kirjakeele teataja II. 1993–2000. Emakeele Selts 2000, lk 83-105
Ethn = Ethnologue, sh

koodide koondtabel (sisaldab ISO 639-1, -2 ja -3 koode ühes tabelis)

Glottolog
ISO 639-1
ISO 639-2
ISO 639-3
ISO 639-5
JaDM1982 = Языки и диалекты мира. Проспект и словник. Москва, "Наука" 1982. (Академия наук СССР. Институт языкознания.)
JaMiBal2006 = Языки мира. Балтийские языки. Academia, Москва 2006
JaMiIra1997 = Языки мира. Иранские языки I. Юго-западные иранские языки. "Индрик", Москва 1997. // Иранские языки II. Северо-западные иранские языки. "Индрик", Москва 1999. // Иранские языки III. Восточноиранские языки. "Индрик", Москва 2000
JaMiKav2001 = Языки мира. Кавказские языки. Academia, Москва 2001
JaMiMon1997 = Языки мира. Монгольские языки. Тунгусо-маньчжурские языки. Японский язык. Корейский язык. "Индрик", Москва 1997
JaMiPal1997 = Языки мира. Палеоазиатские языки. "Индрик", Москва 1997
JaMiTju1997 = Языки мира. Тюркские языки. "Индрик", Москва 1997
JaNSR1966 = Языки народов СССР. Т. III: Финно-угорские и самодийские языки. Москва 1966
JaNSR1967 = Языки народов СССР. Т. IV: Иберийско-кавказские языки. Москва 1967
JaRo2002 = Государственные и титульные языки России. Энциклопедический словарь-справочник. Academia, Москва 2002
Laur2000 = Mall Laur (koost.). Keelkonnad ja keeled. Koolibri, Tallinn 2000
LES1990 = Лингвистический энциклопедический словарь. "Советская энциклопедия", Москва 1990
LOW2009 = Keith Brown, Sarah Ogilvie (Eds.). Concise Encyclopaedia of Languages of the World. (C) Elsevier, 2009
MRahv1966 = Maailma rahvastik. Teatmik. Eesti Raamat, Tallinn 1966
Motz2007 = Hartmut Motz. Sprachen und Völker der Erde. Linguistisch-ethnographisches Lexikon in 3 Bänden. 1. Auflage. (C) Projekte-Verlag Cornelius GmbH, Halle 2007
NET_Frö – Werner Fröhlich. Geonames.de. The countries of the world in their local languages and scripts, with official names, capitals, flags, administrative divisions and translations of the country and capital names into many different languages. 2004–
NET_Laval = Jacques Leclerc. L'aménagement linguistique dans le monde. Université Laval, Québec 2009
NET_Wiki = Wikipedia
Soosaar2007 = Sven-Erik Soosaar. Põhja-Ameerika indiaanlaste nimetused. (Emakeele Seltsi keeletoimkonna koosolekuks 23.05.2007.) Sh kasutusnäited: "Indiaanlased" (2003), "Tomahookide aeg" (1980)
WWS1996 = The World's Writing Systems. Edited by Peter T. Daniels and William Bright. Oxford University Press, New York & Oxford 1996

Tagasiside: Peeter Päll