
L’Europe Mise Sur Les Modèles Open Source Pour Sa Souveraineté Digitale
L'Europe accélère sa marche vers la souveraineté numérique, un objectif devenu priorité absolue ces dernières années. Et c'est dans le domaine brûlant de l'intelligence artificielle que se joue la dernière bataille, avec le lancement d'un ambitieux projet : OpenEuroLLM. Porté par un consortium de 20 organisations, ce programme vise à développer une série de modèles de langage open source, couvrant l'intégralité des langues officielles de l'Union Européenne, actuelles comme futures.
OpenEuroLLM, le fer de lance de l'IA souveraine européenne
Mené de front par Jan Hajič, linguiste computationnel de l'Université Charles de Prague, et Peter Sarlin, CEO et cofondateur du lab finlandais Silo AI (récemment acquis par AMD pour 665 millions de dollars), OpenEuroLLM s'inscrit dans la droite lignée de la stratégie européenne d'autonomie numérique. L'objectif ? Rapatrier au plus près les infrastructures et outils critiques, des centres de données aux solutions d'IA.
Un budget conséquent, mais des interrogations
Si l'enveloppe allouée de 37,4 millions d'euros peut sembler dérisoire face aux investissements massifs des géants de la tech, OpenEuroLLM compte bien capitaliser sur l'expertise de ses membres et l'accès privilégié aux supercalculateurs du projet EuroHPC, véritable colonne vertébrale de l'infrastructure IA du vieux continent. Néanmoins, l'étendue de la tâche et le nombre de parties prenantes soulèvent des questions quant à la faisabilité du projet dans les délais impartis.
Europe's recent successes in AI shine through small focused teams like Mistral AI and LightOn — companies that truly own what they're building.
– Anastasia Stasenko, co-fondatrice de Pleias
Un écosystème en ébullition
Loin de partir de zéro, OpenEuroLLM s'appuie sur les travaux du projet HPLT (High Performance Language Technologies), coordonné par Jan Hajič depuis 2022, qui a permis de constituer de vastes jeux de données et de poser les bases d'une collaboration paneuropéenne. De son côté, Silo AI planche déjà sur la prochaine génération de modèles « Europa », avec pour ambition de supporter l'ensemble des langues du continent.
- Première version prévue pour mi-2026
- Modèles finaux attendus d'ici 2028
- Objectif de qualité et de transparence maximales
Open source : entre idéal et réalité
Si la volonté d'ouverture est clairement affichée, la question de la disponibilité des données d'entraînement reste en suspens. Soumis aux contraintes du droit d'auteur européen et aux futures réglementations sur l'IA à haut risque, le consortium devra probablement faire des compromis entre transparence et performance. Un équilibre délicat, qui ne manquera pas de faire débat au sein de la communauté open source.
La course à l'IA européenne est lancée
Malgré les défis à relever, OpenEuroLLM incarne la volonté de l'Europe de peser dans la course mondiale à l'IA. Face aux mastodontes américains et aux ambitions chinoises, l'union fait la force. Et même si le résultat final ne rivalise pas avec les state-of-the-art, disposer de modèles de langage made in Europe, respectueux des valeurs et des langues du continent, constituera déjà une victoire en soi. Reste à transformer l'essai, et à fédérer un écosystème foisonnant autour de cet ambitieux projet. Le pari est lancé !