Cette pépite franco-américaine est en train de réussir là où les robots humanoïdes peinent encore : manipuler le monde

Author:

L’intelligence artificielle a beaucoup évolué depuis la sortie de ChatGPT il y a trois ans et demi. La tendance actuelle est aux agents, pour permettre à l’IA d’évoluer de manière autonome dans le monde numérique. En ce qui concerne le monde réel, l’IA commence à peine à savoir effectuer certaines tâches comme des humains. C’est ce que l’on appelle l’IA physique, ou l’IA incarnée, autrement dit quand elle manipule le monde physique via des robots.

Ces robots peuvent prendre n’importe quelle forme, mais le plus souvent la discussion autour de l’IA physique fait référence aux robots humanoïdes. S’ils progressent, ils sont encore lents et maladroits. On se souviendra, par exemple, de Figure 02 qui remplit péniblement un lave-vaisselle, ou encore une machine à laver. C’est un problème auquel s’attaque l’entreprise franco-américaine Genesis AI, qui souhaite briser le plafond de verre de la dextérité avec un modèle d’IA pour robots baptisé Gene-26.5.

Grâce à Gene-26.5, ce robot peut manipuler les objets avec une grande dextérité. © Genesis AI

Un robot à la dextérité hors norme

La startup a été fondée par Theophile Gervet, ancien chercheur chez Mistral, et Zhou Xian. Elle bénéficie notamment du soutien de Xavier Niel et Éric Schmidt. Genesis AI a publié une série de vidéos qui montrent un robot cuisiner des œufs et des tomates, remplir des pipettes, jouer du piano, résoudre un Rubik’s Cube et préparer un smoothie. Le robot est même capable d’effectuer des tâches d’une seule main, comme ramasser plusieurs objets entre ses doigts, ou casser un œuf. Genesis AI n’indique pas combien de prises ont été nécessaires, mais chaque activité est publiée dans une vidéo séparée, filmée sous plusieurs angles, sans coupure et sans accélération. L’avancée est bien réelle, et impressionnante.

Yann LeCun lève 1 milliard pour une IA d’un nouveau genre : que sont les « world models » ?

Yann LeCun est très critique envers les modèles d’IA générative. Pour lui, ils présentent une impasse et c’est pour cette raison qu’ils ne parviendront pas à se hisser en tant qu’IA générale. Avec sa société AMI Labs basée à Paris, il vient d’attirer un financement de près d’un milliard d’euros pour développer son IA basée sur les World Models. Futura vous explique pourquoi ce type d’IA pourrait bien révolutionner le secteur…. Lire la suite

Nous sommes loin, ici, des grands modèles de langage (LLM) qui propulsent les chatbots. Gene-26.5 combine les modèles vision-langage (VLM) avec les modèles de monde, les World Models. Les premiers encodent l’intention et les représentations sémantiques, tandis que les seconds capturent les dynamiques physiques et temporelles.

Regardez ce robot jouer du piano. © Genesis AI

Des gants pour une meilleure collecte de données

Pour parvenir à ce résultat, Genesis AI a construit son propre robot. Tout comme l’entreprise allemande Agile Robots, elle s’est concentrée sur les mains. La firme a aussi mis au point des gants portés par des humains pendant qu’ils effectuent des tâches. Cela permet de collecter directement des données sur les activités qui peuvent être transférées au robot. Cette méthode serait 100 fois moins coûteuse que les alternatives, tout en améliorant la qualité des données collectées. Genesis AI indique travailler avec des partenaires pour que ces gants soient utilisés dans des environnements de travail réels. Il suffit que les employés portent les gants pendant leurs tâches habituelles pour que le robot puisse les apprendre. L’IA est aussi entraînée sur des vidéos tournées à la première personne, ainsi que des clips disponibles sur Internet.

La startup indique aussi utiliser une simulation particulièrement avancée pour l’entraînement, s’appuyant sur « une représentation d’une précision et d’une fiabilité uniques des conditions réelles, avec un moteur de rendu et des lois physiques hyperréalistes ». La faible différence entre la simulation et le monde physique permet au robot d’utiliser directement les compétences apprises pendant son entraînement sur des tâches bien réelles. Cela accélère considérablement l’apprentissage de nouvelles tâches.

Genesis AI se décrit comme une entreprise de robotique full-stack, autrement dit de bout en bout. Cela inclut donc la collecte de données avec les gants, et le côté logiciel, avec Gene-26.5 et la simulation. Pour le côté matériel, la startup affirme qu’elle présentera bientôt un robot polyvalent. Il sera sans doute très similaire à celui visible dans les vidéos.

Leave a Reply

Your email address will not be published. Required fields are marked *