Minu Juured
Platvorm, mis muudab Rahvusarhiivi käsikirjalised hingeloendid masinloetavaks ja teeb ajaloolised perekonnalood kõigile kättesaadavaks.
Miks see projekt?
Aastatel 1826–1835 said Liivimaa ja Eestimaa kubermangu talupojad esimest korda ametlikud perekonnanimesid. Need nimed — mis on tänaste eestlaste perekonnanimede alus — on kirjas tuhandetes käsikirjalistes revisjonilehtedes Eesti Ajalooarhiivis.
Probleem: need dokumendid on kirjutatud 19. sajandi saksa kursiivis (Kurrent), raskesti loetavad ja kättesaadavad ainult üksikute lehekülgedena SAAGA digiarhiivis. Seni on nende süstemaatiline digitaliseerimine olnud liiga töömahukas.
Minu Juured kasutab AI-põhist käsikirjatuvastust, et muuta see protsess suurusjärgu võrra kiiremaks: masin loeb dokumendi, inimene kontrollib tulemust.
Kuidas see töötab
Revisjonilehest andmebaasi kirjeni
Mõisa valik
Admin valib mõisa ja laeb üles revisjonilehe PDF-i otse SAAGA digiarhiivist. Soovitav on eelnevalt laadida ka mõisa tähestikuline register, mis toimib nimede kontrollnimekirjana.
AI käsikirjatuvastus
AI-mudel loeb käsikirjalist dokumenti, tuvastab iga perekonna: perekonnanimi, talu, kõik isikud koos vanuste ja suhetega. Tulemus on struktureeritud andmed.
Inimene kontrollib
Admin vaatab parsitud andmed üle, parandab võimalikud vead ja kinnitab salvestamise. Algdokument jääb alati kirjele juurde.
Avalik leht
Iga perekonnanimi saab oma lehe: AI-genereeritud narratiiv eesti keeles, isikute nimekiri, viide algdokumendile ja asukoht ajaloolisel kaardil.
Andmemudel
Kuidas andmed on omavahel seotud
Geograafia
Perekond & dokument
Isiku tuvastamine faas 3
Sama isik eri dokumentides
Carrier = isiku ühekordne ilmumine ühes dokumendis. Person = tegelik inimene, kelle juurde koonduvad kõik tema esinemised eri revisjonides (1816, 1826, 1833...).
See võimaldab jälgida inimese eluteed läbi aastakümnete ja ehitada sugupuid.
Mastaap
Vaherevisjonide andmestik arvudes
Tehniline stack
Kaasaegsed tehnoloogiad, skaleeruv arhitektuur
Platform
- Laravel (PHP), Livewire, MySQL
- Tailwind CSS, Alpine.js
- Leaflet.js, Maa-amet WMS ajalooline kaart
AI pipeline
- Anthropic Claude API — dokumendi visioon
- Extended thinking käsikirja analüüsiks
- Narratiivi genereerimine eesti keeles
Andmed
- PDF-dokumendid SAAGA digiarhiivist
- Nimede kontrollnimekiri tähestikuregistrist
- Algdokumendid alati kirjele kaasas
Arenguteekond
Proof of concept → tööplatvorm → ajalooline sugupuuandmebaas
FAAS 1
Proof of Concept
Prototüüp mitme mõisa andmetega. AI parsimise pipeline toimib, admin paneel olemas, avalik veeb näitab tulemusi.
FAAS 2
Tööplatvorm
Täielik admin süsteem, mis võimaldab süstemaatilist andmesisestust. Optimeeritud täpsus, minimaalne inimkorrektuur.
FAAS 3
Ajalooline sugupuuandmebaas
Laienemine üle 1826/1835 revisjonide: varasemad ja hilisemad hingeloendid. Sama isik eri dokumentides.