L’écart se réduit dangereusement entre la Chine et la Silicon Valley sur l’IA : panorama des dernières avancées

Author:

Le Nouvel An chinois a débuté ce mardi 17 février. Le début des festivités, qui durent quinze jours, a été marqué par la présence de robots humanoïdes exécutant des chorégraphies complexes aux côtés d’humains, une véritable vitrine des avancées récentes du pays dans ce domaine.

Mais ce n’est pas la seule technologie mise en avant lors de cette occasion. Les principales entreprises d’intelligence artificielle chinoises ont profité de cette date pour annoncer leurs derniers modèles.


Lire l’article



Les IA des entreprises chinoises ont connu une progression fulgurante dernièrement, rattrapant leur retard sur les modèles américains, et ce malgré l’interdiction des États-Unis d’exporter les puces d’intelligence artificielle vers la Chine. Même Sam Altman, P.-D.G. d’OpenAI, trouve les progrès « remarquables ». L’embargo pourrait d’ailleurs avoir l’effet inverse de celui recherché, censé freiner le développement de l’IA en Chine.

Alors qu’aux États-Unis, les géants de l’IA comme OpenAI ou Google investissent des sommes astronomiques dans des centres de données gigantesques, les entreprises en Chine sont obligées d’optimiser leur fonctionnement. Cette stratégie politique pourrait conduire à des IA chinoises particulièrement économes face à des usines à gaz américaines.

Dans un entretien sur CNBC, Sam Altman s’exprime sur la vitesse « remarquable » du développement technologique en Chine (à partir de 6:35). En anglais, activez la traduction automatique des sous-titres. © CNBC

Le pari de l’open source

L’une des particularités des modèles chinois est, pour la plupart, d’être open source (sous licence libre), ou au moins open-weight. Dans les deux cas, le modèle peut être téléchargé et utilisé localement. L’usage est donc gratuit (en dehors de l’achat d’un ordinateur suffisamment puissant et la facture d’électricité) et ils n’ont pas les mêmes contraintes que les IA accessibles en ligne, notamment en ce qui concerne la sécurité ou la censure.

Surtout, le contenu des échanges reste entièrement privé. Les modèles open source sont publiés avec l’intégralité de leur code, tandis que les modèles open-weight sont un peu plus limités : le code source et les données d’entraînement ne sont pas publiés, par contre le modèle est accompagné de ses poids, autrement dit le résultat de son entraînement.

Une avalanche de nouveaux modèles : de la vidéo au multimodal

Difficile de parler des IA chinoises sans mentionner le modèle qui a fait le plus grand bruit ces derniers jours, Seedance 2.0. Cette IA est capable de générer des vidéos qui semblent tout droit sorties du cinéma, mais elle fait exception car elle n’est ni open-weight ni open source.


Lire l’article



Seedance 2.0 fait le buzz grâce à la qualité des vidéos, mais son créateur ByteDance, maison mère de TikTok, a rapidement été accusé de violation de droits d’auteur par Disney, Paramount et Netflix.

Alibaba a annoncé Qwen3.5, la dernière version de son modèle vision-langage, un chatbot doté d’une architecture hybride lui permettant de comprendre le texte, les images et les vidéos dans 200 langues. Il peut aussi être déployé en tant qu’agent multimodal, capable d’interagir avec des formulaires et des sites Web. Qwen3.5 est sous licence libre et peut être téléchargé depuis GitHub.

Un autre modèle open source est GLM-5 annoncé le 11 février par Zhipu AI. Selon le développeur, il est conçu pour « l’intelligence agentique, le raisonnement multi-étape avancé et les performances de pointe ». Ce modèle est basé sur DeepSeek Sparse Attention (DSA), une technique qui limite de manière stratégique l’attention du modèle afin de le rendre plus efficace. Il a la particularité d’être entièrement entraîné sur des puces Huawei Ascend, le rendant entièrement indépendant des semi-conducteurs américains. Il est aussi disponible sur GitHub.

Le nouvel an a été l’occasion pour de nombreuses entreprises d’intelligence artificielle en Chine d’exposer leurs nouveaux modèles qui rivalisent avec les IA américaines. © EB, image générée avec Dall-E 3

Toutefois, le modèle le plus attendu est sans doute celui de DeepSeek. La V3 avait fait sensation il y a un an lors de sa sortie, le chatbot affichant des performances rivalisant avec ChatGPT tout en ayant un coût d’entraînement beaucoup plus faible. La V4 devrait sortir dans les prochains jours et serait particulièrement performante en programmation. Selon The Information, il dépasserait Claude d’Anthropic et les modèles GPT d’OpenAI.

Et n’oublions pas Moonshot AI, qui a sorti son nouveau modèle Kimi K2.5 fin janvier. Tout comme Gemini 3.0 Pro, il utilise une approche « mélange d’experts » (MoE), autrement dit plutôt que d’essayer d’être bon en tout, il se divise en sous-réseaux qui deviennent spécialisés dans différentes tâches. Cette technique permet de limiter la puissance de calcul nécessaire.

La réduction de l’écart avec les géants américains

Si les modèles américains comme ChatGPT et Gemini gardent encore une petite avance dans les résultats sur de nombreuses tâches, l’écart est devenu minime. La possibilité de faire tourner les modèles chinois localement, et donc sans envoyer le contenu des échanges, ni sur les serveurs d’OpenAI ou de Google ni sur des serveurs en Chine, rend les modèles chinois beaucoup plus intéressants dans un contexte professionnel. Ces modèles pourraient donc rapidement conquérir le marché de l’IA dans le monde entier.

Leave a Reply

Your email address will not be published. Required fields are marked *