Clau per emportar
- Una nova eina basada en IA podria ajudar els historiadors a desxifrar textos antics.
- Ítaca és la primera xarxa neuronal profunda que pot restaurar el text que f alta de les inscripcions danyades, identificar la seva ubicació original i ajudar a establir la data de creació.
- AI és útil per omplir les dades que f alten, com ara la ubicació i la data del text, perquè és bo per aprendre patrons molt complexos mitjançant l'anàlisi de dades.
Els avenços recents en intel·ligència artificial (IA) estan impulsant els esforços per entendre el passat.
Ithaca, un model d'aprenentatge automàtic creat per investigadors d'IA de DeepMind, pot endevinar les paraules que f alten i la ubicació i la data del llenguatge escrit, segons un nou article. L'esforç podria ajudar els historiadors a desxifrar manuscrits antics.
"Ítaca és una xarxa neuronal profunda i, com a tal, és increïblement capaç de trobar patrons ocults en grans quantitats de dades", va dir la historiadora Thea Sommerschield, coautora de l'article recent, a Lifewire en un correu electrònic. entrevista. "Aquests patrons podrien ser textuals (gramaticals, sintàctics o vinculats a una 'fórmula' repetida en molts textos) o contextuals (determinades paraules que apareixen de manera coherent en determinats gèneres de textos: per exemple, un decret polític de l'Atenes clàssica que esmenta les paraules 'aliança, consell, assemblea…').”
Revelant el passat
Ítaca és la primera xarxa neuronal profunda que pot restaurar el text que f alta de les inscripcions danyades, identificar la seva ubicació original i ajudar a establir la data de creació, va dir Sommerschield.
Ítaca rep el nom de l'illa grega de l'Odissea d'Homer. Els investigadors van trobar que Ítaca aconsegueix un 62% de precisió a l'hora de restaurar textos danyats, un 71% de precisió a l'hora d'identificar la seva ubicació original i pot datar els textos en un termini de 30 anys des de les dates d'origen.
Les ajudes de visualització d'Ithaca estan pensades per facilitar als investigadors la interpretació dels resultats. Els autors del document van escriure que els historiadors van aconseguir un 25% de precisió quan treballaven sols per restaurar textos antics. Però, el rendiment de l'historiador augmenta fins al 72% quan s'utilitza Ithaca, superant el rendiment del model i mostrant el potencial de cooperació home-màquina.
"Ítaca ofereix resultats interpretables, mostrant la importància creixent de la cooperació entre experts humans i aprenentatge automàtic, i mostra com combinar experts humans amb arquitectures d'aprenentatge profund per afrontar tasques de manera col·laborativa pot superar el rendiment individual (sense ajuda) tant dels humans com dels humans. model en les mateixes tasques ", va dir Sommerschield a Lifewire.
Per exemple, actualment els historiadors no estan d'acord sobre la data d'una sèrie d'importants decrets atenesos fets en una època en què vivien personatges notables com Sòcrates i Pèricles, va escriure Sommerschield en una publicació al bloc. Durant molt de temps s'ha pensat que els decrets s'havien escrit abans del 446/445 aC, tot i que noves proves suggereixen una data del 420 aC. "Tot i que pot semblar una petita diferència, aquests decrets són fonamentals per a la nostra comprensió de la història política de l'Atenes clàssica", va escriure
El treball més proper a Ithaca és una eina d'aprenentatge automàtic anterior anomenada Pythia que Sommerschield i els seus col·laboradors van llançar el 2019. Pythia va ser el primer model antic de restauració de textos que va utilitzar xarxes neuronals profundes.
"Avui, Ithaca és el primer model que aborda les tres tasques centrals del flux de treball de l'epígraf de manera holística", va dir Sommerschield en un correu electrònic. "No només avança l'estat de l'art anterior establert per Pythia, sinó que també utilitza l'aprenentatge profund per a l'atribució geogràfica i cronològica per primera vegada i a una escala sense precedents.”
AI per ajudar els historiadors
AI és útil per omplir les dades que f alten com la ubicació i la data del text perquè és bo per aprendre patrons molt complexos mitjançant l'anàlisi de dades, va dir Brad Quinton, director general de l'empresa d'IA Singulos Research, a Lifewire per correu electrònic.
"Utilitzant tècniques d'aprenentatge automàtic, la IA pot buscar un gran nombre d'exemples "bons coneguts" per trobar patrons entre, per exemple, un text determinat i la seva data i ubicació de creació", va afegir Quinton. "Sovint, aquests patrons són tan complexos que no serien obvis per a un expert humà."
Predir les dades que f alten és una tasca habitual per a la IA basada en l'aprenentatge automàtic. Per exemple, GPT-3 d'OpenAI pot predir paraules que f alten en una frase o fins i tot frases que f alten en un paràgraf. I molts sistemes de processament d'imatges basats en IA s'han utilitzat per restaurar el vídeo i les imatges predint de manera intel·ligent el que s'ha perdut de l'original.
"Conceptualment, els investigadors podrien utilitzar tècniques similars per determinar la data i l'origen de l'art o les eines, o altres artefactes històrics fets per l'home on hi ha una expectativa de canvi en l'estil i la tècnica subjacents al llarg del temps i per ubicació de origen", va dir Quinton.