Krāsaina bilde,  ArchXAI projekta klātienes darba semināra dalībnieki

2026. gada 23. un 24. aprīlī Latvijas Nacionālais arhīvs rīkoja divu dienu ArchXAI semināru, pulcējot Latvijas Nacionālajā bibliotēkā vairāk kā 50 partnerus no Igaunijas, Somijas, Latvijas un Dienvidaustrumu Somijas Lietišķo zinātņu universitātes (Xamk).

Semināra darba grupu pirmajā sesijā dalībnieki prezentēja arhīvu darba procesu analīzes rezultātus visās trīs partnervalstīs. Eksperti identificēja vairākus arhīva darba procesa trūkumus. Klientiem bieži vien trūkst pamatzināšanu, lai efektīvi formulētu savus pieprasījumus. Arhīvistiem informācija ir jāmeklē vairākās fragmentētās datubāzēs, kuru izmantošanai nepieciešamas padziļinātas vietējās un lingvistiskās zināšanas. Arhīvu krājumā ir plašs vēsturisko dokumentu klāsts dažādās valodās – latviešu, igauņu, krievu un vācu valodās, kas rada ievērojamas interpretācijas problēmas.

Pamatojoties uz šiem secinājumiem, semināra dalībnieki definēja piecas galvenās spējas, kas būtu jānodrošina projekta ietvaros izstrādājamā mākslīgā intelekta (MI) rīkam:

  1. apvienota teksta atpazīšana,
  2. visaptveroša dokumentu indeksēšana,
  3. vienota piekļuve vairākām datubāzēm,
  4. vienots veids, kā kodēt arhīvistu netiešās profesionālās zināšanas,
  5. mākslīgā intelekta atbalstīts tērzēšanas robots, kas vadītu gan darbiniekus, gan plašāku sabiedrību sarežģītu meklējumu veikšanā.

Otrajā semināra dienā semināra dalībnieki pētīja MI atbalstīta arhīvistu darba rīku komplekta funkcionalitātes iespējas un iespējamās prioritātes, kā arī mēģināja modelēt iespējas, kā šāds instruments varētu atbalstīt arhīvistus viņu ikdienas darbā. Semināra laikā dalībnieki apsprieda, kā MI balstīti rīki varētu palīdzēt racionalizēt arhivēšanas procesus, samazināt manuālo darbu un paātrināt informācijas izgūšanu un analīzi. Radošās diskusijās semināra dalībnieki noteica galvenās funkcionālās vajadzības un izstrādes prioritātes rīkiem, kas paredzēti, lai praktiski veicinātu darba procesus arhīvā.

Otrās semināra dienas pēcpusdienā tika prezentēts šobrīd izstrādes procesā esošo praktisko MI indeksēšanas moduļu stāvoklis. Tika aplūkotas trīs komponentes:

  1. nosaukto vienību atpazīšana, personu, organizāciju un atrašanās vietu identificēšanai tekstā, kas šobrīd sasniedzis vērā ņemamus precizitātes rādītājus – 84% ​​latviešu valodā un 91% krievu valodā;
  2. personu identificējošas informācijas noteikšana, lai atbalstītu dokumentu anonimizāciju un atbilstību tiesību aktiem;
  3. eksperimentāla toņu un noskaņojuma klasifikācija.

Semināra dalībnieki salīdzināja darba ātrumu un apstrādes priekšrocības, strādājot ar specializētiem modeļiem un lieliem valodas modeļiem — desmitiem dokumentu sekundē, salīdzinot ar mazāk nekā vienu dokumentu sekundē. Semināra dalībnieki vēroja tiešraides demonstrācijas un saņēma uzaicinājumu iesaistīties gaidāmajā pilotprogrammā, kas balstītos uz cilvēka vadītu pārraudzību, esošo sistēmu integratīvu līdzāspastāvēšanu un metadatu sadarbspēju.

Seminārs notika ArchXAI projekta ietvaros, kas ir Centrālās Baltijas jūras programmas iniciatīva un ko līdzfinansē Eiropas Savienība ar kopējo budžetu gandrīz 3 miljonu eiro apmērā. Projekta mērķis ir modernizēt arhīvu pakalpojumus visā reģionā, izmantojot mākslīgā intelekta darbināmus rīkus rokraksta teksta atpazīšanai (HTR), optiskajai rakstzīmju atpazīšanai (OCR) un automatizētai katalogizēšanai un indeksēšanai. Projekts ir strukturēts trīs darba paketēs un izstrādā arhīviem risinājums, lai pārvaldītu rokrakstus, trauslus un nedigitalizētus vēsturiskus ierakstus, izstrādājot risinājumus, kas iegūst bagātīgus metadatus, tostarp vārdus, datumus un dokumentu toni, un padara tos pieejamus, izmantojot esošās arhīvu sistēmas.

Projekts ArchXAI norisinās no 2025. gada jūnija līdz 2028. gada maijam, un ir paredzēts, lai pārrobežu mantojumu padarītu pieejamāku vēsturniekiem, ģenealogiem, studentiem un iedzīvotājiem.

Saistītas tēmas

Aktualitātes:
ArchXAI Starptautiskā sadarbība