Aleteia

Kako umetna inteligenca razkriva vatikanske tajne arhive

VATICAN SECRET ARCHIVES
Fregonese Daniele | Vatican Secret Archives | AFP
Deli
Komentar

S pomočjo novih računalniških programov in skupinskih reševanj problemov bodo skozi stoletja ročno napisani dokumenti v latinščini lahko dostopni tudi na spletu

Vatikanski tajni arhivi (Archivum Secretum Vaticanum) zvenijo kot del teorij zarote, ki jih v svojih delih opisuje Dan Brown (avtor Da Vincijeve šifre, op. prev.). V resnici pa gre zgolj za zasebne (iz latinske besede secretum) papeževe arhive. Odkar je Leon XIII. leta 1881 arhive odprl za raziskovalce, niti niso več zasebni. Ko so vatikanski dokumenti stari 75 let, jih znanstveniki lahko preučujejo, kolikor jih je volja.

Ogromno materiala

Teoretično to pomeni, da so raziskovalcem na voljo zgodovinski dokumenti, vatikanski odloki, računovodske knjige in korespondenca papežev od 8. stoletja dalje.  Edina težava je ta, da so arhivi zaradi preobilice zbranega materiala skorajda nedostopni. Od okoli 85 kilometrov polic v vatikanskih tajnih arhivih naj bi bilo doslej skeniranih, prepisanih in na spletu dostopnih le nekaj milimetrov.

Tu pa nastopi raziskovalni projekt In Codice Ratio, ki z uporabo umetne inteligence in optičnega prepoznavanja znakov (Optical Character Recognition oziroma OCR) samodejno prepisuje vsebine vatikanskih arhivov. OCR izvrstno deluje na tipkanih dokumentih, ne zmore pa razvozlati rokopisa. Črke se namreč zlivajo v eno in niso vedno tako razločne, da bi jih naprava lahko prepoznala.

Vloga umetne inteligence

To težavo pomaga reševati umetna inteligenca. Raziskovalci so za pomoč najeli italijanske dijake brez kakršnegakoli poznavanja srednjeveške latinščine. Predstavili so jim vzorce črk, ki jih program OCR prepozna, dijaki pa so preverjali, ali se te črke skladajo s tistimi v rokopisih. Morali so torej le usklajevati vzorce. Računalniški program je zaznal popravke, ki so jih vnesli dijaki, in se “učil na svojih napakah”.

Ko so projekt začeli, “se je zamisel, da bi vanj vključili dijake, zdela nesmiselna”, se spominja Paolo Merialdo, znanstvenik, ki sodeluje pri projektu. “Zdaj pa se zaradi njihovega truda naprava uči, kako naj deluje. Všeč mi je, da neznaten in preprost prispevek množice ljudi resnično lahko pomaga pri reševanju zapletenega problema.”

Mešani rezultati

Prepisovanje teh starodavnih dokumentov v računalniški jezik seveda tudi danes ni preprosto in rezultati so zelo mešani. Tretjina besed vsebuje pravopisne napake, zaradi česar je branje malce nadležno, še vedno pa vse skupaj pomeni velik napredek.

“Nepopolni prepisi lahko zagotovijo ravno dovolj informacij in konteksta, da koristijo raziskovalcem,” je pojasnil Merialdo. Poleg tega pa znanstveniki, ki se ukvarjajo s tem projektom, pričakujejo, da se bo računalniški program s časom še izboljšal, kajti umetna inteligenca z “učenjem” vse bolj napreduje.

 

Prispevek je nastal po izvirniku, ki ga je objavila ameriška izdaja Aleteie. Prevedla in priredila Mojca Masterl Štefanič.

Tags:
Vatikan
E-novice
Prejmi Aleteio v svoj e-nabiralnik. Naroči se tukaj.