Sisukord
English

5. Eestis kasutatav ladina tähtede valik (ESET1)

ESET1 on valik, millesse kuuluvate tähemärkide kasutamine muutmata kujul on kohustuslik kõigis Eestis väljastatavates dokumentides ja andmebaasides. ESET1 on standardile ISO/IEC 10646 vastav kodeeritud märgistik rakendusastmel 1, mis tähendab, et ESET1 ei sisalda kombineeruvaid diakriitilisi märke ja kõigile tähemärkidele on vastavusse seatud ISO/IEC 10646 kood. ESET1 on fikseeritud, st sellesse kuuluvate tähtede ja lisamärkide hulk on lõplik ning seda ei laiendata.

ESET1 (242 märki) jaguneb vormiliselt kaheks -- kõigilt Unicode'il põhinevatelt rakendustelt nõutavaks osaks ISO 646 IRV (koodid <0020> kuni <007E>, k.a. ladina alustähestiku tähed 'A' kuni 'Z' ja 'a' kuni 'z') ja täiendavaks ladina tähtede hulgaks (kokku 147 tähemärki). ESET1 jaguneb ka sisuliselt -- tähtedeks (199+2) ja lisamärkideks. Märke apostroof <0027> ja jutumärgid <0022> tuleb ESET1 rakendusvaldkonda arvestades käsitleda mitte kirjavahemärkide vaid tähtedena. Tähtede hulka pole arvatud muid isiku- ja kohanimedes esineda võivaid kirjavahemärke (sidekriips <002D>, punkt <002E>, tühik <0020>, kaldkriips <002F>, koma <002C>, kohanimedes ka sulud, numbrid jms). Valikusse kuuluvate märkide loend on esitatud lisas A. Kõik märgid leiduvad tähevalikus Windows Glyph List 4 (WGL4) ja vähemalt ühes järgnevas kooditabelis ISO 8859-1, 2, 9 või 13.

Ladina tähtede valik on tehtud ühe kitsa ja täpselt piiritletud valdkonna vajadusi arvestades. ESET1 kirjeldab, milliseid tähti ja märke kasutatakse isiku- ja kohanimedes. Kui registrisse või dokumenti tuleb kanda isikunimi, milles sisaldub ESET1 mitte kuuluvaid tähemärke, otsustatakse nende kirjaviis ESET1 tähemärke kasutades eraldi igal üksikjuhul. Paralleelselt kantakse registrisse ka nime originaalkuju ladina kirjas, kasutades selle kodeerimiseks allpool esitatud viise.

ESET1 ei sea rakendustele otseseid nõudeid kasutatava sisemise kodeerimisviisi kohta. Soovitatav on mitte seada ülempiiri nime võimalikule pikkusele, seda eriti juhul, kui andmebaasi kantakse nimi teksti kujul ning säilitatakse koodid noolsulgude vahel. See võib takistada pikkade ja paljusid võõrtähti sisaldavate võõrnimede kandmist andmebaasi. Kodeeringutega, kus ühe tähe esitamiseks kasutatakse muutuvat arvu baite (nt UTF-8 või kodeerimine noolsulgudes), kaasneb ka nõue, et tähe kodeeringuks kasutatud baitide rühm peab alati moodustama terviku, st seda ei tohi katkestada nime jätkamisel andmebaasi lisaväljades, poolituskoha määramisel jm.

Kõik ESET1 kasutavad rakendused peavad andmevahetuses võimaldama järgmise kodeerimisviisi kasutamist:

Sellise kodeeringu kasutamisel kehtivad täiendavalt järgmised nõuded:

Rakendused võivad kokkuleppel kasutada andmevahetuseks ka muid kodeerimisviise. UTF-8 on soovitatav.

ESET1 võimaldab kasutada vähemalt järgnevaid Euroopa keeli: albaania, bulgaaria, eesti, grööni, hispaania, hollandi, horvaadi, iiri, inglise, islandi, itaalia, leedu, läti, makedoonia, norra, poola, portugali, prantsuse, rootsi, rumeenia, saksa, serbia, slovaki, sloveeni, soome, taani, ts^ehhi, türgi, ungari.

Järgnevaid keeli võimaldab ESET1 kasutada osaliselt: kõmri, liivi, malta, saami.