Kako umetna inteligenca razkriva vatikanske tajne arhive

S pomočjo novih računalniških programov in skupinskih reševanj problemov bodo skozi stoletja ročno napisani dokumenti v latinščini lahko dostopni tudi na spletu

Vatikanski tajni arhivi (Archivum Secretum Vaticanum) zvenijo kot del teorij zarote, ki jih v svojih delih opisuje Dan Brown (avtor Da Vincijeve šifre, op. prev.). V resnici pa gre zgolj za zasebne (iz latinske besede secretum) papeževe arhive. Odkar je Leon XIII. leta 1881 arhive odprl za raziskovalce, niti niso več zasebni. Ko so vatikanski dokumenti stari 75 let, jih znanstveniki lahko preučujejo, kolikor jih je volja.

Preberite še:
Zakaj so vatikanski arhivi “tajni”?

Ogromno materiala

Teoretično to pomeni, da so raziskovalcem na voljo zgodovinski dokumenti, vatikanski odloki, računovodske knjige in korespondenca papežev od 8. stoletja dalje. Edina težava je ta, da so arhivi zaradi preobilice zbranega materiala skorajda nedostopni. Od okoli 85 kilometrov polic v vatikanskih tajnih arhivih naj bi bilo doslej skeniranih, prepisanih in na spletu dostopnih le nekaj milimetrov.

Tu pa nastopi raziskovalni projekt In Codice Ratio, ki z uporabo umetne inteligence in optičnega prepoznavanja znakov (Optical Character Recognition oziroma OCR) samodejno prepisuje vsebine vatikanskih arhivov. OCR izvrstno deluje na tipkanih dokumentih, ne zmore pa razvozlati rokopisa. Črke se namreč zlivajo v eno in niso vedno tako razločne, da bi jih naprava lahko prepoznala.

Preberite še:
Ali “vatikanski skrivni prehod” resnično obstaja?

Vloga umetne inteligence

To težavo pomaga reševati umetna inteligenca. Raziskovalci so za pomoč najeli italijanske dijake brez kakršnegakoli poznavanja srednjeveške latinščine. Predstavili so jim vzorce črk, ki jih program OCR prepozna, dijaki pa so preverjali, ali se te črke skladajo s tistimi v rokopisih. Morali so torej le usklajevati vzorce. Računalniški program je zaznal popravke, ki so jih vnesli dijaki, in se “učil na svojih napakah”.

Ko so projekt začeli, “se je zamisel, da bi vanj vključili dijake, zdela nesmiselna”, se spominja Paolo Merialdo, znanstvenik, ki sodeluje pri projektu. “Zdaj pa se zaradi njihovega truda naprava uči, kako naj deluje. Všeč mi je, da neznaten in preprost prispevek množice ljudi resnično lahko pomaga pri reševanju zapletenega problema.”

Mešani rezultati

Prepisovanje teh starodavnih dokumentov v računalniški jezik seveda tudi danes ni preprosto in rezultati so zelo mešani. Tretjina besed vsebuje pravopisne napake, zaradi česar je branje malce nadležno, še vedno pa vse skupaj pomeni velik napredek.

“Nepopolni prepisi lahko zagotovijo ravno dovolj informacij in konteksta, da koristijo raziskovalcem,” je pojasnil Merialdo. Poleg tega pa znanstveniki, ki se ukvarjajo s tem projektom, pričakujejo, da se bo računalniški program s časom še izboljšal, kajti umetna inteligenca z “učenjem” vse bolj napreduje.

Prispevek je nastal po izvirniku, ki ga je objavila ameriška izdaja Aleteie.Prevedla in priredila Mojca Masterl Štefanič.

Preberite še:
Ste vedeli, da vatikanske zidove belijo s kravjim mlekom?

RED SHOES

Preberite še:
Zakaj so papeži nosili rdeče čevlje in zakaj ima Frančišek črne?

Kako umetna inteligenca razkriva vatikanske tajne arhive

Ogromno materiala

Vloga umetne inteligence

Mešani rezultati

Podprite Aleteio!