Nimekirjutus

Nimekujude järjestus

Väliskohanimede andmebaasis on esikohale seatud eestikeelses tekstis kasutatavad kujud, nii nagu "Maailma kohanimede" sõnastikuski. (Ingliskeelses osas on see teisiti, vt selle kirjeldust.)


Nimed latinisatsioonis ja originaalkujul

Põhimõtteliselt on kõik nimekujud KNABis antud ladinatähelisel kujul, st originaalkirjas või ladina tähestikku ümber kirjutatult, sest ladinatähelise kuju abil variante järjestatakse ja saab sooritada nende päringuid. Lisaks on SRÜ-väliste kohtade venekeelseid nimesid esitatud ka üksnes vene tähestikus, nende otsimiseks saab kasutada eraldi vormi.

KNABis esitatavad mitteladina kirjakujud on programmi abil tekitatud. Mitteladina kirjas nimesid pannakse KNABis kirja transkriptsiooni ja transliteratsiooni abil. Põhimõtteliselt taasesitatakse mitteladina kirjakujud üksnes nende nimede osas, mis on talletatud otseallikast, st originaalkirjas nimekujudest. (See selgitab asjaolu, miks mitte kõik vastavakeelsed nimed ei sisalda originaalkirjas nimekuju.) Mõnel juhul on sellest reeglist siiski erandeid, kui on leitud, et vastavas allikas on originaalkirjas nimed latiniseeritud usaldatavalt täpselt. Sellisel juhul tekitatakse ka mitteladinatäheline nimekuju. Vigu originaalkujude esitamisel ei saa kahjuks kunagi täielikult vältida, ent need võivad tekkida mitmes faasis: vigane võib olla olnud juba allikas kasutatud kuju (latinisatsioon), vigu võis tekkida transkribeerimisel või translitereerimisel otseallikast ja vigu võib sisaldada ka mitteladinatähelise kuju tekitamise programm (kuigi tulemusi on ulatuslikult kontrollitud).


Nimede kodeering

Alates 19. juulist 2004 on kohanimeandmebaasi nimekujud Interneti-väljundis esitatud täielikult UTF-vormingus, ilma varem kasutusel olnud tingtähistusteta. Ladina-, kreeka- ja kirillitsatähelistele nimekujudele on nüüd lisaks tekitatud nimevariandid muudes mitteladina kirjades (araabia, hiina, tamili jne). Kõigi nimekujude korrektse esituse eelduseks on uuemate brauserite (nt Firefox, Netscape 7.1 või Internet Explorer 6.0) kasutamine, samuti Unicode'i fontide olemasolu.

Kõige laiemalt sisaldavad Unicode'i tähemärke niisugused fondid, nagu Arial Unicode MS või Bitstream Cyberbit. Täpsemalt kirjeldavad Unicode'i olemust ja sobivaid fonte Alan Woodi Unicode'i veebisait ja David McCreedy Unicode'i fontide loend.  Sealt saab hankida fonte puuduvate kirjade tarvis. Omaette probleem on aga sageli selles, et kuigi vastavad tähemärgid võivad fondis küll olla (nt Arial Unicode MS-is), ei taga see veel nimede korrektset esitust, sest vajalikud on ka väikesed abiprogrammid, mis valivad fondist välja õiged ligatuurid ja panevad märgid õigesse järjekorda. Mida uuemad arvutid ja uuemad programmid, seda vähem niisuguseid raskusi peaks olema. Allpool on esitatud isiklikke tähelepanekuid Windows 98 II põhjal, seega kõigil uuematel operatsioonisüsteemidel on eeldusi puudujääke üksnes vähendada.

Font Arial Unicode MS peaks olema suuteline korrektselt esitama järgmisi kirjasüsteeme: ladina (k.a diakriitikutega tähed, nt vietnami), araabia (sh pärsia, puštu, uiguuri, urdu), armeenia, devanagari (hindi, marathi, nepali jt), gruusia, gudžarati, gurmukhi (pandžabi), heebrea, hiina (traditsiooniliste ja lihtsustatud märkidega), jaapani (logograafiliste tähemärkide vaikimisi põhikujud), kannada, kirillitsa (k.a turgi jm keelte eritähed), korea, kreeka (k.a klassikaline kreeka), tai ja tamili. Fondis on ka nt bengali, lao, malajalami, oria, telugu ja tiibeti tähemärgid, ent nende esitus ei ole korrektne (st fondis puuduvad vajalikud rakendustabelid).

Font Bitstream Cyberbit sisaldab tähemärke järgmistest kirjasüsteemidest: ladina, araabia, heebrea, hiina (logograafiliste märkide vaikimisi põhikujud), jaapani, kirillitsa, kreeka, tai.

Järgmiste keelte ja kirjasüsteemide jaoks tuleks vajaduse korral hankida eraldi sobivad fondid (vt ülal antud linke): bengali, birma, etioopia (amhari ja tigrinja), Kanada põliselanike silptähestikud (inuktituti), khmeeri, lao, malajalami, oria, singali, telugu, thaana (maldiivi) ja tiibeti. Birma ja singali jaoks praegu puuduvad avalikult kättesaadavad sobivad fondid. Sobiva valiku esitab nt Werner Fröhlichi maailma maade, haldusüksuste jm nimetuste mitmekeelse loendi juurde lisatud tabel.

Kui olete brauseris vaikimisi Unicode'i fondiks määratlenud nt Arial Unicode'i, siis võib Teil tekkida raskusi nende kirjadega, mille jaoks on Teil küll olemas sobiv font, ent mis on olemas (puudulikul kujul) ka Arial Unicode MS-is, nt lao või tiibeti. Sellisel juhul võtab brauser kõik kättesaadavad märgid sealt ega kasuta talle vastava keele kohta ettekirjutatud fonte. Selle probleemi vältimiseks on kaks tülikat võimalust: 1) muutke nendes kirjades nimede vaatamise ajaks Unicode'i vaikimisi fondiks mõni muu font, mis ei sisalda vastava kirjasüsteemi märke, nt Times New Roman; 2) kopeerige tekst nt Wordi dokumenti ja valige seal nimekuju(de) jaoks sobiv font. Viimase hõlbustamiseks on mitmes kirjasüsteemis tekstijadad varustatud märgendiga <span lang="..">.....</span>. Kui see asendada nt märgendiga <font face="....">....</font>, siis avab Word vastava lehekülje juba sobivaid fonte kasutades. NB! Mõne kirja suund on paremalt vasakule (araabia, heebrea, thaana jm), nende puhul sisaldub kõnealuses märgendis ka suunatähis (nt <span dir="rtl" lang="ar">); kui see ära kaob, moondub ka nende nimede esitus.

Järgnevad tehnilist laadi selgitused võiksid huvi pakkuda neile, kes soovivad nimede korrektset esitust või tahavad neid oma rakendustes kasutada. Eri põhjustel on Unicode'i standardile (mis on peaaegu samaväärne ISO standardiga ISO10646) vastavaid koode siiski ka pisut kohaldatud.

Ladina.

Araabia

Kirillitsa

Devanagari, bengali, gurmukhi (pandžabi), kannada, tamili

Hiina ja jaapani