Les grandes entreprises d'IA injectent de l'argent dans les modèles mondiaux alors que les LLM progressent lentement
-
Les modèles mondiaux (World models) visent à naviguer dans le monde physique en apprenant à partir de vidéos et de données robotiques.
Résumé:
Les grands acteurs de l’IA (Google DeepMind, Meta, Nvidia…) s’orientent vers les « modèles mondiaux », une nouvelle génération de systèmes capables de comprendre et simuler le monde physique, au-delà des simples modèles de langage (LLM) dont les progrès ralentissent.
Ces modèles sont entraînés sur des données réelles ou simulées (vidéos, robots, cartes 3D) et visent des applications majeures en robotique, voitures autonomes, santé, fabrication, mais aussi dans le divertissement (jeux vidéo, cinéma).
DeepMind a présenté Genie 3, qui génère des vidéos interactives image par image.
Meta développe V-JEPA inspiré de l’apprentissage des enfants, tout en continuant d’investir dans ses modèles de langage Llama.
Nvidia, via sa plateforme Omniverse, mise sur « l’IA physique » pour révolutionner la robotique, avec un potentiel estimé à 100 000 milliards de dollars.
Start-up et partenaires (World Labs, Runway, Niantic) exploitent ces approches pour créer des environnements réalistes et collecter des données du monde réel.
Ces modèles nécessitent toutefois des volumes colossaux de données et de calcul, et leur pleine maturité pourrait prendre une dizaine d’années. Mais les experts estiment qu’ils représentent une étape clé vers une intelligence artificielle de type humain et une valeur économique gigantesque.
Source: https://arstechnica.com/ai/2025/09/big-ai-firms-pump-money-into-world-models-as-llm-advances-slow/
Les procès pour violation de droits d’auteur ne sont peut-être pas non plus étrangers à ce changement d’approche.