L’IA peine à maîtriser l’histoire selon une nouvelle étude

Home - Technologies et Avenirs - Intelligence Artificielle - L’IA peine à maîtriser l’histoire selon une nouvelle étude
LIA peine à maîtriser lhistoire selon une nouvelle étude   Innovationsfr
janvier 19, 2025

L’IA peine à maîtriser l’histoire selon une nouvelle étude

Si l'intelligence artificielle (IA) excelle dans certaines tâches comme la programmation ou la génération de podcasts, une nouvelle étude révèle qu'elle peine encore à réussir un examen d'histoire de haut niveau. Une équipe de chercheurs a mis au point un benchmark inédit, baptisé Hist-LLM, pour tester les capacités historiques de trois des principaux modèles de langage : GPT-4 d'OpenAI, Llama de Meta et Gemini de Google.

Un test sans appel pour les IA

Le benchmark Hist-LLM évalue la validité des réponses fournies par les IA en se basant sur la base de données historiques Seshat Global History Databank, nommée d'après la déesse égyptienne de la sagesse. Malheureusement, les résultats présentés lors de la prestigieuse conférence NeurIPS se sont avérés décevants selon les chercheurs affiliés au Complexity Science Hub (CSH) basé en Autriche.

Le modèle le plus performant, GPT-4 Turbo, n'a atteint qu'une précision d'environ 46%, à peine plus élevée qu'une réponse au hasard. Maria del Rio-Chanona, co-auteure de l'étude, résume ainsi les conclusions :

Les modèles de langage, bien qu'impressionnants, manquent encore de la profondeur de compréhension requise pour l'histoire avancée. Ils excellent sur les faits de base, mais pour une recherche historique plus nuancée, de niveau doctoral, ils ne sont pas encore à la hauteur.

– Maria del Rio-Chanona, professeure associée en informatique à l'University College de Londres

Des erreurs historiques révélatrices

Les chercheurs ont partagé avec TechCrunch des exemples de questions historiques auxquelles les IA ont mal répondu. Par exemple, GPT-4 Turbo a affirmé à tort que l'armure à écailles était présente à une période spécifique de l'Égypte antique, alors que cette technologie n'y est apparue que 1 500 ans plus tard.

Selon Maria del Rio-Chanona, ces lacunes s'expliquent probablement par la tendance des modèles de langage à extrapoler à partir de données historiques très répandues, peinant à retrouver des connaissances historiques plus obscures. Ainsi, GPT-4 a répondu incorrectement que l'Égypte ancienne disposait d'une armée professionnelle permanente à une période donnée, probablement en se basant sur des informations similaires concernant d'autres empires comme la Perse.

Des biais géographiques identifiés

L'étude a également mis en lumière d'autres tendances problématiques, notamment des performances moindres des modèles OpenAI et Llama pour certaines régions comme l'Afrique subsaharienne, suggérant des biais potentiels dans leurs données d'entraînement.

Pour Peter Turchin, qui a dirigé l'étude, ces résultats montrent que les IA ne peuvent pas encore remplacer les humains dans certains domaines. Cependant, les chercheurs gardent espoir que ces technologies puissent à terme aider les historiens, notamment en affinant leur benchmark avec davantage de données issues de régions sous-représentées et en ajoutant des questions plus complexes.

Vers une IA au service de l'histoire

Malgré des résultats mitigés, cette étude ouvre des perspectives prometteuses quant à l'utilisation future de l'IA dans la recherche historique. En soulignant les axes d'amélioration des modèles de langage, elle pose les jalons d'une collaboration fructueuse entre intelligence artificielle et sciences humaines.

À mesure que les IA progresseront dans leur maîtrise des subtilités et de la complexité propres à l'histoire, elles pourraient devenir de précieux outils pour les chercheurs, facilitant l'accès à des connaissances obscures et offrant de nouvelles pistes d'analyse. Une alliance entre la puissance computationnelle des machines et l'expertise humaine qui laisse entrevoir une nouvelle ère pour l'étude de notre passé.

Share:

Ajouter Un Commentaire

Chercher

Catégories

Étiquettes

abus technologie Accord OpenAI Apple accélérateur innovation santé accélérateur startup accélérateur startups acquisition stratégique Amazon addiction réseaux sociaux adoption IA générative adoption intelligence artificielle all4pack emballages durables innovations packaging écoconception économie circulaire Andreessen Horowitz Twitter influence réseaux sociaux capital risque autonomie véhicules électriques avenir IA générative avenir intelligence artificielle barquettes inox consigne réduction déchets Berny transition écologique BoJ politique monétaire relance économique achats d'obligations transition monétaire campus cybersécurité chiffres inflation cloud computing commissaires vie privée compétitivité industrie automobile européenne conduite autonome confiance intelligence artificielle controverse Elon Musk crise financement startups données personnelles défis véhicules autonomes expansion internationale expérience utilisateur FinTech canadienne Géotechnique Décarbonation industrie Empreinte carbone Transition énergétique Prototype innovant IA conversationnelle IA industrie 4.0 Imagino levée de fonds marketing digital données clients expansion internationale Industrie du futur Relocalisation industrielle Transition écologique Startups deeptech Souveraineté technologique marchés financiers mobilité durable mobilité urbaine souveraineté numérique startup innovante startups innovantes transformation numérique transition énergétique économie circulaire énergies renouvelables

Beauty and lifestyle influencer

Follow my journey on all Social Media channels

Alienum phaedrum torquatos nec eu, vis detraxit periculis ex, nihilmei. Mei an pericula euripidis, hinc partem ei est.
facebook
5M+
Facebook followers
Follow Me
youtube
4.6M+
Youtube Subscribers
Subscribe Me
tiktok
7M+
Tiktok Followers
Follow Me
instagram
3.4M+
Instagram Followers
Follow Me