Avec la sortie de GPT-5, ChatGPTChatGPT connaît une mise à jour majeure. Loin d’être révolutionnaire, il promet tout de même des performances améliorées. Futura a testé le nouveau modèle dans sa version gratuite.
Premier point : le codage
Un test intéressant est la génération d’une image au format SVG. C’est une image vectorielle, autrement dit composée uniquement de formes géométriques, à l’inverse des images JPGJPG ou PNG, qui sont composées de pixels. C’est une tâche assez complexe et le résultat est une série de lignes de code. Il faut coller ce code dans un fichier texte, puis changer l’extension de .txt en .svg. Pour générer cette image, le prompt lui demande de dessiner un robot qui remplit une machine à laver, avec l’indication « réfléchis bien » pour activer le raisonnement approfondi. Attention, les comptes gratuits ne peuvent utiliser cette astuce qu’une fois par jour.
ChatGPT réfléchit pendant 31 secondes, affichant les différentes étapes de la création, et notamment qu’il utilise le raisonnement approfondi. À tout moment, il est possible de l’interrompre pour avoir une réponse rapide. Il génère 151 lignes de code. Le résultat est assez basique, mais tout de même intéressant. Et l’IAIA a animé le bras, le vêtement, et même le hublot de la machine à laver.
L’image vectorielle (SVG) générée par GPT-5 est plutôt détaillée et est animée (ici en version jpg sans animation). © ChatGPT
Dans un autre test, ChatGPT devait créer un jeu de casse-briques en remplaçant les briques par des chatons et la balle par une pelote de laine. Il a fallu lui demander de l’éditer au moins cinq fois avant d’avoir un résultat ne serait-ce qu’à moitié fonctionnel, mais les images étaient remplacées par des carrés bleus. ChatGPT a d’abord tenté d’utiliser des images de Wikipedia, avant de choisir un autre service d’hébergement. Mais le problème a persisté et le chatbot n’a pas su le résoudre seul.
Dans la seule version fonctionnelle du casse-briques que GPT-5 a su générer, les images étaient remplacées par un message d’erreur. © ChatGPT
Le Nil ou l’Amazone ?
Futura avait déjà mis à l’épreuve de précédentes versions de ChatGPT (GPT-3.5 et GPT-4GPT-4) en leur demandant quel était le fleuve le plus long du monde, une question dont la réponse fait débat. Contrairement à ses prédécesseurs, GPT-5 anticipe le problème est donne des chiffres plus précis.
« Le fleuve le plus long du monde est généralement considéré comme le Nille Nil, avec environ 6 650 km.
Cependant, certaines mesures récentes donnent un léger avantage à l’AmazoneAmazone (environ 6 800 km) selon la façon dont on définit sa source et ses affluents.
En résumé :
Nil → plus long selon les mesures traditionnelles.
Amazone → plus long selon certaines études modernes.
C’est donc un débat… un peu comme savoir si la pizza à l’ananasananas est une bonne idée. »
Des hallucinations encore présentes
GPT-5 est censé avoir moins d’hallucinationshallucinations, mais cela ne signifie pas pour autant qu’il ne se trompe plus. Certains ont repéré des erreurs factuelles sur des sujets complexes, mais la nouvelle version de ChatGPT peut aussi se tromper sur une équationéquation mathématique simple.
Demandez-lui de résoudre 5,9=x+5,11 et il ne vous répondra pas 0,79, mais -0,21. L’erreur disparaît si vous séparez les différents éléments par des espaces, ou que vous commencez avec 5,90 au lieu de simplement 5,9. ChatGPT semble penser que le premier chiffre est 5,09 au lieu de 5,9. Une erreur facile à repérer et à corriger avec cette formule simple, mais qui pourrait passer complètement inaperçue avec une équation plus complexe.
GPT-5 a encore des difficultés avec des formules mathématiques basiques. © ChatGPT
Les avis des réseaux sociaux
Un bon moyen de savoir si une mise à jour est réussie est de voir la réaction sur les réseaux sociauxréseaux sociaux, et notamment sur des forums comme Reddit. Il y aura toujours quelques personnes pour se plaindre, mais si les publications se multiplient sur le même sujet, cela suggère une tendance plus importante. Et sur Reddit, GPT-5 est critiqué sur deux points.
Tout d’abord, la personnalité du chatbot a changé. Afin de rendre le chatbot moins flagorneur, autrement dit trop flatteur et servile, OpenAI a procédé à quelques changements. Et désormais de nombreux utilisateurs trouvent ses réponses trop froides.
La seconde critique concerne le codage. Si ChatGPT s’est beaucoup amélioré, le consensus général semble être qu’il est encore loin d’être au même niveau que Claude Opus 4.1. Le chatbot d’Anthropic serait bien plus compétent.
Les utilisateurs critiquent aussi beaucoup les limites imposées à ChatGPT. Comptez 10 messages en cinq heures pour les utilisateurs gratuits, ou 80 messages en trois heures pour les abonnés Plus. C’est très peu. Au-delà de cette limite, ChatGPT bascule sur une version mini de GPT-5.
Mais bon nombre de critiques sont sans doute en réaction à la manière dont la mise à jour a été effectuée. L’accès aux anciens modèles a été tout simplement retiré, alors que beaucoup d’utilisateurs avaient créé des tâches spécifiques à chaque version. Ils n’ont tout simplement plus le choix qu’ils avaient auparavant, et un certain nombre menacent de se désabonner.
Que penser de GPT-5 ?
Sur les réseaux sociaux, beaucoup crient au scandale et accusent GPT-5 d’être catastrophique. Toutefois, ce n’est pour l’instant qu’un ressenti. Il faudra attendre des retours plus concrets avant d’en avoir le cœur net. Mais pour les utilisateurs sans abonnement à ChatGPT qui ont aussi accès à GPT-5, l’amélioration est notable. S’ils ne peuvent invoquer explicitement le mode de raisonnement qu’une fois par jour, le chatbot peut basculer dessus automatiquement lorsqu’il le juge nécessaire, sans que cela soit décompté de la limite. De plus, si ChatGPT hallucine encore, le nombre d’erreurs a été réduit. La nouvelle version du chatbot est donc beaucoup plus fiable, ce qui reste le point le plus important.