Eesti Keele Instituut

EKI tarkvara


SILBITUS


andmefailid



programmid



lähtekood (C)

Silbitus

NB! Vaata ka silbibaase sõnaloendite osas

 


Silbitusreeglid «Eesti keele käsiraamatust»:

Silp koosneb ühest või mitmest häälikust. Eesti sõnade silbitamisel kehtivad järgmised reeglid:

  1. üksik kaashäälik täishäälikute vahel kuulub järgmisse silpi: ka-la, lu-ge-mi-ne, e-la-gu;
  2. kui täishäälikute vahel on mitu kaashäälikut kõrvuti, siis kuulub ainult viimane neist järgmisse silpi: tul-la, kur-vad, kind-lam, mars-si-ma, mürts-ti;
  3. (üli)pikk täishäälik või diftong kuulub tavaliselt ühte silpi: pii-lub, suu-bu-ma, lau-lud, toa, lui-tu-nud; kui kahe vokaali vahelt läheb morfeemipiir, siis kuuluvad nad ka eri silpidesse: ava-usava on tüvi, us on tuletusliide;
  4. kolme täishääliku järjendist kuulub viimane teise silpi: põu-a-ne, luu-ad, lai-ad, rii-u, hoi-us-te;
  5. liitsõnades silbitatakse iga koostisosa eraldi: tä-he-tea-dus, va-na-e-ma, las-te-ai-a-laps;
  6. võõrsõnu silbitatakse üldiselt nagu eesti omasõnu: dü-na-mo (1. reegel), bar-rel, port-fell (2. reegel), faa-san (3. reegel), muu-se-um (muuse on tüvi, um tuletusliide — 3. reegli erijuhtum), o-aas, mah-hi-nat-si-oon (4. reegel, kuid eri silpi võib kuuluda ka esimene vokaal);
  7. liitvõõrsõnu võib silbitada kahte moodi: kas nagu liitsõnu või nagu lihtsõnu, nt fo-to-graaf ~ fo-tog-raaf, te-le-skoop ~ te-les-koop, de-pres-si-oon ~ dep-res-si-oon; kui võõrsõna järelosa on eesti keeles iseseisva sõnana tarvitusel, on soovitatav liigendada liitsõnana, nt des-in-fekt-si-oon (mitte de-sin-fekt-si-oon), sub-troo-pi-ka (mitte subt-roo-pi-ka), mo-no-gramm (mitte mo-nog-ramm).

Poolitamisel kehtivad silbitamisreeglid, aga ühe kitsendusega: ühte tähte ei jäeta üksinda rea lõppu ega kanta üle järgmise rea algusse, st lühike vokaalsilp jääb eelmise või järgmise silbi juurde: sõnu onu, oli, saia, võie ei saa poolitada, põuane poolitub ainult põua-ne.

Juhul kui liitsõna sidekriips satub poolituskohta, siis võib teda täpsemas tekstis, nt teatmeteoses, järgmise rea algul korrata: kartuli-
-lehemädanik
.

Võõrnimede poolitamisel on soovitatav mitte lahutada tähejärjendit, mis hääldub ühe häälikuna, nt ck, ch, sch, sh, th, tz, sz: Bro-cken, Man-ches-ter, Rem-scheid, Pemb-roke-shire, Sou-thern, Ko-tze-bue, Báta-szek. Liitvõõrnimesid võib poolitada kas nagu liitsõnu või nagu lihtsõnu: Pet-ro-grad ~ Pet-rog-rad, Neu-stadt ~ Neus-tadt, Gold-smith ~ Golds-mith.

Ja märkus:

Kui sõna lõpeb järjendiga täishäälik1-täishäälik2-kaashäälik (eriti eum, ium, ion, nt `pension), pole sõna silbitumine üheselt selge. Nt sõna `pension võib silbituda `pen-si-on või `pen-sion. Esimesel juhul on sõna kolmesilbiline ning kuulub seminar-tüüpi: `pension : `pensioni : `pensioni..., teise silbitamisviisi korral osutub sõna kahesilbiliseks ning kuulub järelikult IV käändkonna redel-tüüpi: `pension : `pensioni : `pensioni/t...

Silbitust kasutavad kõik teised morfoloogiamoodulid, sest sageli sõltub silpide arvust sõna käänamine või pööramine.

Vt lisaks moodulite üldiseloomustus.


Silbitusmoodulit saab kasutada ainult lihtsõnade silbitamiseks. Liitsõnades määratakse silbipiirid valesti põhiliselt kahel juhul:

  1. kui teine sõna algab täishäälikuga: va-nai-sa, hõl-pe-lu, pä-ri-to-lu jne
  2. kui teine sõna algab kaashäälikuühendiga: naist-rak-to-rist, ve-rep-roov jne

Liitsõnu on küll võimalik silbitada, kui juba sisestamisel märkida liitsõnapiir '+' või '-'-märgiga kuid 'tööstuslik' silbitamine peaks käima käsikäes morfoloogilise analüüsiga, mis eelnevalt liitsõnad osadeks jagab. Liitsõnataolistes võõrsufiksiga sõnades on ebasobivat silbitust siiski püütud juba mooduli sees ära hoida. Moodul arvestab silbitusel silbituserandite failiga syll.exc, kus

  • # tähistab sõna algust või lõppu;
  • @ tähistab silbipiiri (võimalik märkida ainult üks);
  • * on suvaline täht;
  • W on täishäälik, C kaashäälik;
  • 'nokaga' > lõppevad read on erandlikud, kuid saavad lisaks reeglipärase silbituse.

Algoritm: silbi piir märgitakse

  • kaashääliku ette, millele järgnes täishäälik (kui see pole esimene täishäälik sõnas);
  • kolme täishääliku + kaashääliku ühendis viimase täishääliku ette, kui aga kaks viimast täishäälikut on samad, siis nende ette;
  • järgsilbi kahe täishääliku + kaashääliku ühendis on silbipiir täishäälikute vahel ühendeis i+aeou, e+ao, u+aeo ja ü+ao.


1. Kui installeerite esimest korda, looge esmalt sobiv kataloogipuu. Loogiline kataloogide struktuur võiks olla:

c:\eki_morfo\programmid\            (programmid)
c:\eki_morfo\programmid\silbitus\   (lähtekood kui kavatsete seda kasutada)
c:\eki_morfo\andmed\                (andmefailid)

2. Laadige oma arvutisse andmefailid (est_morpho_data.zip) ja pakkige need lahti andmekataloogi. Andmefailid võivad küll asuda samas kataloogis programmide ja teekidega, parem lahendus on aga hoida andmefaile omaette kataloogis ja panna selle nimi keskkonnamuutujasse EST_MORPHO_DATA (vt juhend).

3. Laadige oma arvutisse programmid (syll_bin.zip) ja pakkige lahti morfoloogiaprogrammide kataloogi.

(4.) Kui leiate, et teile pakub huvi programmide lähtekood või, mis veel parem, olete valmis seda täiustama, laadige oma arvutisse koodifailid (syll_code.zip) ja pakkige lahti programmide kataloogi sobiva nimega alakataloogis.

Silbitus koosneb:

teegid:

  • syllabif.dll
  • patmatch.dll
  • cw3230.dll

andmefailid:

  • syll.exc (silbituserandid)
  • syllabif.ini (täpitähtede koodid)
  • chars.ini (täheklassid)


Tegemisel:

  • uus versioon peaks lugema faili chars.ini ja lubama erandites kasutada kõiki täheklasse;
  • silbitus võiks ka poolitada;
  • sisend peaks lubama sõnu, milles rõhk ja välde on märgitud;
  • versiooninumbri kontroll puudu.


Programme puudutavad küsimused: tarkvara@eki.ee