venerdì, 29 Marzo 2024
NuoveTecnologie

I CARATTERI CUNEIFORMI DELL’ACCADICO TRADOTTI DALL’INTELLIGENZA ARTIFICIALE

Per leggere questo articolo occorrono 2 minuti

Un team internazionale di ricercatori ha sviluppato un modello di intelligenza artificiale per tradurre automaticamente in inglese un testo in lingua accadica scritto in caratteri cuneiformi.

In un articolo pubblicato sulla rivista PNAS Nexus, Volume 2, Numero 5 di maggio 2023, Gai Gutherz, Omer Levy e Jonathan Berant della Scuola di Informatica dell’Università di Tel Aviv, Shai Gordin e Luis Sáenz del Digital Pasts Lab del Dipartimento di Studi e Archeologia della Ariel University, hanno esplicato il risultato di una ricerca che potrebbe essere rivoluzionaria.

Il cuneiforme è uno dei primi sistemi di scrittura registrati nella storia umana (circa 3.400 a.C.-75 d.C.) ecentinaia di migliaia di tali testi sono stati trovati negli ultimi due secoli, la maggior parte dei quali sono scritti in sumerico e accadico.

Nell’articolo, i ricercatori mostrano l’elevato potenziale che l’applicazione potrebbe avere nell’assistere studiosi e profani interessati nello studio di queste scritture fondamentali nella storia della cultura dell’uomo.

L’intelligenza artificiale utilizza metodi di elaborazione del linguaggio naturale (NLP), come le reti neurali convoluzionali (CNN, si utilizzano in numerose applicazioni allo scopo di ottenere un trasferimento di dati affidabile), per tradurre automaticamente l’accadico dai caratteri cuneiformi in codici Unicode inglese (C2E) e dalla traslitterazione ottenuta all’inglese (T2E).

Con l’applicazione, inoltre, è possibile ottenere traduzioni di alta qualità traducendo direttamente dal cuneiforme all’inglese, ottenendo rispettivamente 36,52 e 37,47 punteggi Best Bilingual Evaluation Understudy 4 (BLEU4, un algoritmo per valutare la qualità del testo che è stato tradotto automaticamente da una lingua naturale a un’altra) rispettivamente per C2E, Unicode inglese, e T2E, l’inglese dalla translitterazione.

Per C2E, il modello presentato è migliore della baseline della memoria di traduzione in 9.43, e per T2E, la differenza è ancora più alta e si attesta a 13,96. Il modello ottiene i migliori risultati in frasi di breve e media lunghezza (circa 118 caratteri o meno) ma, con l’aumentare del numero di testi digitalizzati, il modello può essere migliorato con una ulteriore formazione della memoria interpretativa, rendendo l’applicazione parte di un sistema umanoide nel ciclo che traduce i risultati definitivi di una tavoletta in cuneiforme accadica.

Attendiamo sviluppi anche per altre lingue moderne e per altri tipi di geroglifici…

 

Tradotto e rielaborato da Daniele Mancini

 

Geroglifici

Ciao! Lascia un commento o una tua considerazione. Grazie

error: Il contenuto è protetto!!