L'IA au-delà du langage - Fei-Fei Li et World Labs visent la création de mondes virtuels
La marraine de l'IA défie le scepticisme ambiant avec une vision révolutionnaire de l'intelligence artificielle spatiale.
Dans un contexte où certains analystes tech et sceptiques professionnels annoncent l'éclatement de la bulle de l'intelligence artificielle et le retour d'un "hiver de l'IA", Fei-Fei Li, surnommée la marraine de cette technologie, adopte une position radicalement différente. Non seulement elle rejette cette vision pessimiste, mais elle mise gros sur l'avenir avec son nouveau projet World Labs.
Une vision audacieuse
Actuellement en congé partiel de l'université de Stanford, Fei-Fei Li a cofondé World Labs avec une ambition claire, aller au-delà de l'IA générative basée sur le langage pour créer des systèmes capables de construire des mondes complets. Ces derniers, virtuels, seraient dotés de la logique et des détails riches qui caractérisent notre réalité physique. C'est un objectif ambitieux, surtout à une époque où certains prétendent que les progrès dans le domaine ont atteint un plateau. World Labs semble pourtant avoir le vent en poupe côté financement. Bien que l'entreprise soit encore à environ un an de son premier produit, dont l'efficacité reste à prouver, les investisseurs ont déjà injecté 230 millions de dollars, valorisant cette jeune startup à un milliard.
De l'ImageNet aux mondes virtuels
Il y a une dizaine d'années, Li a contribué à une avancée majeure en IA en créant ImageNet, une base de données d'images qui a permis aux réseaux de neurones de faire un bond en avant en termes d'intelligence. Aujourd'hui, elle estime que les modèles d'apprentissage profond actuels ont besoin d'une impulsion similaire pour franchir une nouvelle étape: la création de mondes virtuels, qu'ils soient des simulations réalistes ou des univers totalement imaginaires. Elle imagine un futur où les créateurs, tels que les écrivains d’heroic fantasy, pourraient en composer sous forme de prompts plutôt que de prose, permettant ensuite aux utilisateurs de les visualiser et de s'y promener.
"Le monde physique, pour les ordinateurs, est vu à travers des caméras, et le cerveau informatique derrière celles-ci", explique-t-elle. "Transformer cette vision en raisonnement, en génération et finalement en interaction implique de comprendre la structure et la dynamique physique du monde réel. Cette technologie s'appelle l'intelligence spatiale."
L'équipe derrière World Labs
Pour concrétiser cette vision, Li a rassemblé une équipe de haut vol. Parmi les cofondateurs, on trouve Justin Johnson, l’un de ses anciens étudiants devenu professeur assistant à l'université du Michigan, Christoph Lassner, inventeur d'une technique de rendu 3D appelée "3D Gaussian Splatting", et Ben Mildenhall, créateur de la technologie NeRF (neural radiance fields) qui transforme des images 2D en graphiques 3D. À court terme, World Labs vise à construire un modèle doté d'une compréhension profonde de la tridimensionnalité, de la physicalité et des notions d'espace et de temps. La phase suivante consistera à développer des modèles supportant la réalité augmentée. À plus long terme, ces avancées pourraient améliorer les voitures autonomes, les usines automatisées et même les robots humanoïdes.
Un pari risqué mais prometteur
Bien que World Labs promette un produit pour 2025, les détails sur sa nature exacte et ses clients potentiels restent flous. L'entreprise pourrait suivre le modèle de plateformes comme ChatGPT ou Claude d'Anthropic, où le modèle lui-même est le produit, utilisé directement ou hébergeant d'autres applications. Les clients pourraient inclure des entreprises de jeux vidéo ou des studios de cinéma. World Labs n'est d’ailleurs pas la seule société à s'attaquer à ce qu'on appelle parfois l'IA physique. Nvidia, par exemple, travaille sur des modèles de base. Il est difficile de ne pas voir des similitudes entre les promesses de World Labs et le buzz récent autour du métavers. Les fondateurs de l’entreprise expliquent que la vague de ce dernier était prématurée, basée sur du matériel prometteur mais manquant de contenu interactif approprié. Ils suggèrent que les grands modèles de monde pourraient résoudre ce problème. Alors que l'IA continue d'évoluer à un rythme effréné, des visionnaires comme Fei-Fei Li et son équipe repoussent les frontières de ce qui est possible. Que leur pari sur l'intelligence spatiale s'avère révolutionnaire ou non, il est clair que l'histoire de l'IA est loin d'être terminée. L'avenir nous dira si cette nouvelle itération nous permettra vraiment de créer et d'explorer des mondes entièrement nouveaux, bridant ainsi le fossé entre l'imagination humaine et la réalité virtuelle.
Ready Player One...