Tekstituvastus

Rahvusarhiiv on aastaid oma kogusid digiteerinud ja Saaga veebikeskkonna kaudu kõigile mugavalt kasutatavaks muutnud. Samas on huvialuse infoni jõudmine tihti jätkuvalt väga ajakulukas – dokumendid on küll nähtavad pildina, kuid nende sisu ei ole otsitav.

2018. aastal alustasime platvormi Transkribus abil ajalooliste dokumentide masinloetavaks muutmise katseid. Transkribus võimaldab igaühel arvutit masinõppele toetudes ajaloolisi dokumente „lugema“ õpetada. Vaja on vaid piisavalt korrektselt lahti kirjutatud teksti, mida arvutile treenimiseks ette anda. Mida varieeruvam on allikates käekiri, seda suurem peab olema töötava tekstituvastusmudeli treenimiseks vajalik andmekogus.

Optimismi tekitanud katsetele järgnes alates 2020. aastast suurema ettevõtmisena õigeusu koguduste sünnimeetrikate sisu tuvastamine. Kui luteri koguduste tarvis on genealoogide eestvedamisel loodud personaalraamatute nimeregister, siis õigeusu kirikuraamatute jaoks otsiabivahend puudus.

Otsingu lihtsustamiseks venekeelsetest allikatest võimaldab siinne lahendus ladina tähtedes otsisõna automaatselt kirillitsasse üle kanda. Tuleb arvestada, et arvuti tuvastatud tekst pole vigadeta, lisaks võib – eriti nimede puhul – nende kirjapilt ajaloolistes allikates varieeruda. Kui otsing ei too tulemusi, tasub otsinguvõimaluste alt muuta otsingu veataluvust ehk otsisõnast erinevate tähemärkide osakaalu tuvastatud tekstis.

Siinsest veebikeskkonnast leiad järgnevad allikakogud:

  • Õigeusu koguduste sünnimeetrikad
  • Tartu linnavolikogu protokollid
  • Supliigid Eestimaa rootsiaegsele kindralkubernerile

Õigeusu koguduste sünnimeetrikad

Meetrikaraamat on register, mis sisaldab kronoloogilises järjekorras sündide, abiellumiste ja surmajuhtumite sissekandeid. Siinsesse andmebaasi on kokku kogutud kõik Rahvusarhiivis säilitatavad õigeusu kirikute sünnimeetrikad alates 1838. aasta meetrikate reformist kuni 1926. aastani, mil perekonnaseadusega lõppes perekonnaseisudokumentatsiooni pidamise kohustus kirikutes. Pärast Eesti Vabariigi iseseisvumist peeti eestikeelsetes kogudustes meetrikaid eesti keeles, neid pole otsitavaks muudetud. Samuti ei leia siit Tallinna Linnaarhiivis säilitatavaid Tallinna koguduste meetrikaid.

Sünnimeetrikasse on märgitud lapse sünni ja ristimise aeg, lapse nimi, vanemate nimed ja päritolu koos seisuse või ametiga ning vaderite nimed. Tekstituvastuse abil on otsitavaks muudetud lapse nimi ning vanematega seonduv info. Sünnimeetrikasse märgiti kõik koguduses ristitud inimesed, kaasa arvatud usuvahetajad. Need sissekanded erinevad mõneti sünnikannetest – kirja pandi usuvahetaja luteri nimi, õigeusu nimi, päritolu ja vanus. Eriti ulatuslikult leiab selliseid kandeid usuvahetusliikumise ajast Liivimaal 1840., Eestimaal 1880. aastatel.

Meetrikasse kirjutatud nime kirjapilt võib kohati tänapäevasest tugevalt erineda, sõltudes ka meetrikat pidanud köstri või preestri rahvusest. Seega esineb nii eesti- kui ka venepäraselt kirjutatud nimesid. Kohanimede hulgas leiab lisaks saksapäraseid nimevariante.

Kirjutamisel kasutati vana, revolutsioonieelset kirjaviisi, nii on konsonandiga lõppevate sõnade ja nimede lõpus laialt kasutuses tugevdusmärk ъ. 1918. aasta õigekirjareformiga kaotatud tähed ѣ ja i on tekstis asendatud vastavalt е ja и tähega.

Mõned näited meetrikates esinevatest nimekujudest:

Kõiv – Кыивъ, Кеивъ

Päts – Пятсь, Пяцъ

Jõgever – Иегеверъ

Küppar – Кюппаръ

Lihula, sks. Leal – Леалъ, Лигула

Tartu linnavolikogu protokollid

Tartu linnavolikogu tuli esimest korda kokku 1878. aastal, vastavalt aasta varem kehtestatud linnaseadusele. Linnavalitsemine muutus sellega demokraatlikumaks ja läbipaistvamaks, hääleõiguse said seisusteüleselt kõik maksumaksjad, kuigi algul jäid domineerima rikkad baltisakslastest majaomanikud. Linnavolikogu protokollid näitlikustavad muutust valitsemises suurepäraselt. Volikogus kui linna esinduskogus käsitleti kõiki Tartu elu ja arengut puudutavaid teemasid. Elav arutelu volinike vahel avab linnaarengu tagamaid ning viitab teistele suundadele, kuhu Tartu oleks võinud liikuda.

Andmebaasis on protokollid alates 1902. aastast, mil koosolekuid hakati protokollima kirjutusmasinal. Protokollid aastatest 1902–1917, mil Tartu koos ülejäänud Eestiga kuulus Venemaa keisririigi koosseisu, on venekeelsed. 1918.–1940. aastate protokollid koostati eesti keeles, vaid põhiosa 1918. aasta protokollidest on Esimese maailmasõja aegse Saksa okupatsiooni tõttu saksakeelsed. Tartu Ülikooli ajalootudengite abil on 1920. aastate protokolliraamatutes osati märgendatud tekstis esinevad isikud, asutused ja kohad, et nende leidmist hõlpsamaks muuta. Need leiad märksõnade saki alt.

Supliigid Eestimaa rootsiaegsele kindralkubernerile

Eestimaa kubermangus ehk Põhja-Eestis kehtestati Rootsi võim Liivi sõjaga 1561. aastal. Ülejäänud Eesti ala vallutati 17. sajandi jooksul. Rootsi aeg Eestis lõppes alistumisega Venemaale Põhjasõjas 1710. aastal. Rootsi kuningat esindas kohapeal (kindral)kuberner, kelle kätte oli koondatud nii tsiviil-, sõjaväeline kui ka õigusvõim. Samuti oli tema roll esindada provintsi emamaal Rootsis. Sellisena oli kindralkuberner ihaldatud adressaat supliikidele. 

Supliik on palve- ehk kaebekiri halduslikul või juriidilisel teemal. Supliikide vastuvõtmine ja õigetele instantsidele lahendamiseks edastamine oli kubermanguvalitsuse kantselei üks olulisemaid ülesandeid. Vastuvõetud otsused kinnitas kindralkuberner. Palvekirjad on kirjutatud gooti kirjas (täpsemalt saksa kirjutuskirjas ehk kurrendis) suuresti saksa, vähemal määral ka rootsi keeles. Kuna kõiki supliike sisaldavaid säilikuid pole digiteeritud, leiab siit vaid osa palvekirju aastatest 1630–1707.

Küsimuste korral kirjuta: transkribus@ra.ee