Les systèmes d’intelligence artificielle (IA) maîtrisent désormais la reproduction précise des caractères cunéiformes. Ce développement technologique pourrait permettre aux chercheurs d’économiser un temps considérable.
Si l’intelligence artificielle fascine les amateurs de science-fiction depuis des années, elle se démocratise récemment. L’émergence de ChatGPT, un chatbot IA basé sur le modèle GPT, a ouvert la voie à de nouveaux systèmes exploitant la compréhension du langage quotidien.
Qu’il s’agisse de naviguer sur Internet, d’écrire des e-mails, de résumer des vidéos, de programmer ou de créer des images, l’IA aide également les scientifiques à améliorer leurs travaux ou à effectuer des découvertes inédites.
L’IA au service du déchiffrement des caractères cunéiformes
Déchiffrer l’écriture ancienne représente un véritable défi, surtout lorsqu’il s’agit de caractères cunéiformes datant de quelque 3 000 ans. Les chercheurs au Moyen-Orient peuvent désormais demander l’aide de l’intelligence artificielle pour cette tâche complexe.
Les modèles d’IA spécialement entraînés peuvent reconnaître et reproduire des caractères cunéiformes à partir de photos, facilitant ainsi la lecture de ces inscriptions délicates.
Comme les hiéroglyphes égyptiens, le cunéiforme est l’une des premières formes d’écriture, composée d’environ 1 000 caractères distincts. La variation dans l’apparition de ces caractères — selon l’époque, la culture et même l’auteur — complique leur interprétation.
Des chercheurs des universités de Cornell et de Tel Aviv ont mis au point une méthode appelée Protosnap. Cette approche permet d’ajuster un prototype de caractère aux différentes versions présentes sur les tablettes.
À travers cette méthode, l’équipe a testé un modèle de diffusion pour voir s’il pouvait automatiser le déchiffrement. Ce modèle génératif, souvent utilisé pour les tâches de vision par ordinateur, peut établir la similarité entre chaque pixel d’une image de caractère et son prototype. L’alignement des deux versions permet ensuite d’adapter le modèle aux lignes du caractère réel.
Les résultats obtenus montrent un alignement des prototypes avec les images cunéiformes, illustrant à la fois l’alignement global et le raffinement ultérieur.

Les caractères ainsi analysés peuvent ensuite servir à former des modèles d’IA capables d’effectuer une reconnaissance optique de caractères. Cela signifie qu’ils peuvent transformer les images des tablettes en texte compréhensible par des machines.
Les chercheurs affirment que traduire ces données améliore significativement la reconnaissance des caractères cunéiformes, même ceux qui sont peu fréquents ou très variables, par rapport à des essais antérieurs avec l’IA.
« »En explorant le monde ancien, nous découvrons une grande variabilité dans l’écriture, » explique Hadar Averbuch-Elor, professeur associé à Cornell Tech et au Cornell Ann S. Bowers College of Computing and Information Science. « »Même un même caractère peut varier dans son apparence à travers les âges, ce qui complique le déchiffrement automatique.«
On estime à 500 000 le nombre de tablettes cunéiformes conservées dans les musées, mais seules quelques-unes ont été traduites et publiées. Hadar Averbuch-Elor souligne : « Nous avons une quantité illimitée de scans 2D de ces personnages, mais très peu de données étiquetées.«
Rachel Mikulinsky, étudiante en master et co-auteur, présentera le projet «Protosnap : alignement pour les signes cunéiformes Prototype» lors de la conférence internationale sur l’apprentissage représentatif (ICLR) en avril prochain.
« »Notre recherche vise à multiplier les anciennes ressources à notre disposition, » déclare Yoram Cohen, co-auteur et professeur d’archéologie à TAU. « »Cela nous permet d’explorer les données massives et d’obtenir de nouvelles informations concrètes sur les civilisations anciennes, y compris leur économie, leur religion, et leur vie sociale et juridique.«
Ces avancées pourraient faire gagner un temps précieux aux chercheurs tout en automatisant certaines tâches. Ainsi, ils pourraient comparer les données à grande échelle et analyser les caractères issus de différentes périodes, villes ou auteurs.
Source : Changer l’organisation

