Des chercheurs révèlent que l'IA peut désormais décoder des tablettes datant de 5000 ans, gravées de symboles sumériens, assyriens et akkadiens,
elles offrent un aperçu des civilisations anciennes
Des chercheurs des universités Martin Luther de Halle-Wittenberg, Johannes Gutenberg de Mayence et des sciences appliquées de Mayence ont dévoilé une avancée majeure dans la compréhension des anciens textes cunéiformes grâce à un système d'intelligence artificielle (IA) novateur. Publiée dans la revue The Eurographics Association, leur étude s'est concentrée sur des tablettes cunéiformes vieilles de plus de 5000 ans provenant de l'ancienne Mésopotamie. Ces tablettes, gravées de symboles sumériens, assyriens et akkadiens, offrent un aperçu varié des civilisations anciennes, couvrant des sujets allant de la vie quotidienne aux questions juridiques.
Les chercheurs ont développé un modèle d'IA basé sur l'architecture des réseaux neuronaux convolutionnels régionaux (R-CNN) pour décoder ces tablettes. Le processus en deux parties implique d'abord un détecteur de signes, construit sur un modèle RepPoints, identifiant les caractères cunéiformes avec précision. Ensuite, un détecteur de coins, utilisant Point R-CNN avec des caractéristiques avancées, classe et prédit les positions des coins, formant ainsi la base de l'écriture cunéiforme. Cette approche 3D a surmonté les limitations des photographies 2D traditionnelles en termes d'éclairage et de couleur, permettant une analyse plus précise des textes anciens.
Contrairement aux méthodes traditionnelles telles que la reconnaissance optique de caractères (OCR), qui fonctionnent bien pour l'encre sur papier, l'IA développée a pu interpréter les tablettes cunéiformes en 3D. Le système a été entraîné intensivement avec des scans tridimensionnels et des données supplémentaires, permettant une identification précise des symboles. Cette technologie ouvre de nouvelles perspectives de recherche en démocratisant l'accès à ces documents anciens et en facilitant une analyse plus approfondie des textes historiques. Des améliorations futures pourraient élargir son application à d'autres écritures tridimensionnelles, comme les inscriptions altérées trouvées dans les cimetières.
Un nouveau logiciel d'intelligence artificielle est désormais capable de déchiffrer des textes difficiles à lire sur des tablettes cunéiformes. Il a été mis au point par une équipe de l'université Martin Luther de Halle-Wittenberg (MLU), de l'université Johannes Gutenberg de Mayence et de l'université des sciences appliquées de Mayence. Au lieu de photos, le système d'IA utilise des modèles 3D des tablettes, ce qui donne des résultats nettement plus fiables que les méthodes précédentes. Il est ainsi possible d'effectuer des recherches dans le contenu de plusieurs tablettes pour les comparer les unes aux autres. Il ouvre également la voie à des questions de recherche entièrement nouvelles.
Dans leur nouvelle approche, les chercheurs ont utilisé des modèles 3D de près de 2 000 tablettes cunéiformes, dont une cinquantaine provenant d'une collection de l'UML. Selon les estimations, environ un million de ces tablettes existent encore dans le monde. Nombre d'entre elles ont plus de 5 000 ans et comptent donc parmi les plus anciens documents écrits de l'humanité. Elles couvrent un très large éventail de sujets : « On y trouve de tout : des listes de courses aux décisions de justice. Les tablettes donnent un aperçu du passé de l'humanité il y a plusieurs millénaires. Cependant, elles sont fortement altérées et donc difficiles à déchiffrer, même pour des yeux exercés », explique Hubert Mara, professeur assistant à la MLU.
En effet, les tablettes cunéiformes sont des morceaux d'argile non cuits dans lesquels l'écriture a été pressée. Pour compliquer les choses, le système d'écriture de l'époque était très complexe et englobait plusieurs langues. Pour reconnaître correctement les symboles, il faut donc non seulement des conditions d'éclairage optimales, mais aussi de nombreuses connaissances de base. « Jusqu'à présent, il était difficile d'accéder au contenu de plusieurs tablettes cunéiformes à la fois - il fallait en quelque sorte savoir exactement ce que l'on cherchait et où », ajoute Mara.
Son laboratoire a eu l'idée de développer un système d'intelligence artificielle basé sur des modèles 3D. Le nouveau système déchiffre les caractères mieux que les méthodes précédentes. En principe, le système d'IA fonctionne de la même manière que le logiciel OCR (optical character recognition), qui convertit les images d'écriture et de texte en texte lisible par la machine. Cela présente de nombreux avantages. Une fois converti en texte informatique, l'écrit peut être plus facilement lu ou recherché.
« L'OCR fonctionne généralement avec des photographies ou des scans. Cela ne pose pas de problème pour l'encre sur papier ou sur parchemin. Dans le cas des tablettes cunéiformes, en revanche, les choses sont plus difficiles, car la lumière et l'angle de vue influencent grandement l'identification de certains caractères », explique Ernst Stötzner de la MLU. Il a développé le nouveau système d'IA dans le cadre de son mémoire de maîtrise sous la direction d'Hubert Mara.
Un système d’IA novateur pour comprendre les anciens textes cunéiformes
L'équipe a entraîné le nouveau logiciel d'IA à l'aide de scans tridimensionnels et de données supplémentaires. La plupart de ces données ont été fournies par l'Université des sciences appliquées de Mayence, qui supervise un vaste projet d'édition de modèles 3D de tablettes d'argile. Par la suite, le système d'IA a réussi à reconnaître de manière fiable les symboles figurant sur les tablettes. « Nous avons été surpris de constater que notre système fonctionne même avec des photographies, qui sont en fait un matériau de base de moins bonne qualité », explique Stötzner.
Les travaux des chercheurs de Halle et de Mayence permettent d'accéder à un matériel jusqu'ici relativement exclusif et ouvrent de nombreuses pistes de recherche. Jusqu'à présent, il n'existait qu'un prototype capable de discerner de manière fiable les symboles de deux langues. Or, on connaît au total douze langues cunéiformes. À l'avenir, le logiciel pourrait également aider à déchiffrer les inscriptions altérées, par exemple dans les cimetières, qui sont tridimensionnelles comme l'écriture cunéiforme.
Les scientifiques ont déjà présenté leurs travaux lors de plusieurs conférences de renommée internationale, dont la plus récente est la Conférence internationale sur la vision par ordinateur. Il y a quelques semaines, l'équipe a reçu le Best Paper Award à la Graphics and Cultural Heritage Conference.
L'avancée présentée par les chercheurs des universités Martin Luther de Halle-Wittenberg, Johannes Gutenberg de Mayence et des sciences appliquées de Mayence dans la compréhension des anciens textes cunéiformes grâce à l'intelligence artificielle est indéniablement remarquable. L'utilisation d'un modèle d'IA basé sur l'architecture des réseaux neuronaux convolutionnels régionaux (R-CNN) pour décoder des tablettes vieilles de 5000 ans offre une perspective intrigante sur le passé de l'humanité.
Les rendus 3D améliorent la précision de la détection des signes cunéiformes
Les chercheurs, répondant aux besoins de l'assyriologie numérique et aux défis de détecter les signes cunéiformes, présentent une nouvelle approche utilisant l'architecture R-CNN. Ils se basent sur des modèles 3D de 1977 tablettes cunéiformes de la collection Frau Professor Hilprecht, dont environ 500 ont des transcriptions dans la base de données CDLI. Les chercheurs ont annoté 21 000 signes cunéiformes et 4 700 coins, formant ainsi le nouvel ensemble de données de référence cunéiformes de Mayence (MaiCuBeDa). Le pipeline de l'approche comprend un détecteur de signes, utilisant un modèle RepPoints, et un détecteur de coins basé sur l'approche RCNN ponctuelle avec un réseau de pyramides de caractéristiques (FPN) et l'alignement RoI.
L'évaluation de la méthode, effectuée avec différents hyperparamètres et des techniques de post-traitement telles que la suppression non maximale (NMS), révèle des résultats prometteurs dans la détection des coins cunéiformes. Le détecteur de signes montre une meilleure performance lorsqu'il est entraîné sur des rendus 3D plutôt que sur des photographies, bien que la précision des photographies s'améliore avec l'entraînement, y compris sur des rendus 3D. Malgré des limitations dues à la quantité relativement faible de données, le pipeline présente des résultats satisfaisants, soulignant l'impact significatif des rendus de haute qualité d'ensembles de données 3D avec des annotations d'experts sur la détection des signes cunéiformes.
L'approche en deux parties, avec un détecteur de signes et un détecteur de coins, démontre une ingéniosité technique pour surmonter les défis inhérents à la déchiffrabilité des tablettes cunéiformes. La transition de la reconnaissance optique de caractères (OCR) traditionnelle, conçue pour des supports 2D, à une méthode 3D plus complexe, est une réponse créative aux caractéristiques uniques de ces artefacts anciens.
L'accent mis sur l'utilisation de scans tridimensionnels et de données supplémentaires dans l'entraînement intensif de l'IA montre l'engagement de l'équipe à surmonter les obstacles. L'efficacité accrue par rapport aux méthodes conventionnelles, notamment en termes d'éclairage et de couleur dans les photographies 2D, est une avancée significative.
La démocratisation de l'accès à ces documents anciens et l'ouverture de nouvelles voies de recherche grâce à cette technologie sont des aspects louables. Cependant, il est essentiel de rester conscient des limites potentielles de cette approche. Des questions éthiques liées à la manipulation des données et à la préservation de l'intégrité des artefacts peuvent se poser.
En outre, bien que l'article mentionne des améliorations futures pour élargir l'application de cette technologie à d'autres écritures tridimensionnelles, il serait pertinent de souligner les défis possibles liés à cette expansion. L'adaptation de cette méthodologie à des contextes différents pourrait nécessiter des ajustements significatifs et souligner les nuances spécifiques à chaque type d'écriture.
Cette avancée dans la compréhension des tablettes cunéiformes grâce à l'intelligence artificielle représente un progrès significatif, mais il est important de rester conscient des implications éthiques et des défis potentiels lors de l'application de cette technologie à d'autres domaines de recherche.
Source : Martin Luther University Halle-Wittenberg
Et vous ?
Les résultats des travaux de recherche des chercheurs des universités Martin Luther de Halle-Wittenberg sont-ils pertinents ?
Selon vous, pourquoi les chercheurs ont-ils choisi ces tablettes en particulier ?
Quelles sont les implications de cette avancée pour la compréhension de l’histoire ancienne ?
Voir aussi :
L'IA pourrait permettre aux travailleurs de ne travailler que 4 jours par semaine au lieu de 5 et de gagner le même revenu d'ici 2033, selon une étude menée par le groupe de réflexion Autonomy
Les testeurs de logiciels se tournent vers l'IA pour améliorer leur productivité, 78 % d'entre eux ont déjà adopté une forme ou une autre d'IA dans ce but, selon une étude de LambdaTest
Les jetons de l'API Hugging Face exposés offrent un accès complet au lama 2 de Meta, selon Lasso Security
Partager