OpenAI dévoile GPT-Image-1.5 : une riposte attendue après l’avance prise par Google

Author:

ChatGPT était une référence en matière de génération d’images, aux côtés de Midjourney et Stable Diffusion, d’abord avec l’outil Dall-E, puis avec un nouveau modèle baptisé GPT-Image lancé en mars dernier. Tout du moins jusqu’à ce que Google lance Nano Banana, son générateur d’images bien plus rapide et très convaincant. Puis avec la sortie de Gemini 3, Google a présenté Nano Banana Pro, encore plus puissant et disponible gratuitement, creusant un peu plus le fossé avec ChatGPT.

Face à ce retard, OpenAI vient d’annoncer une nouvelle version de ChatGPT Images, jusqu’à quatre fois plus rapide, baptisé GPT-Image-1.5. La génération d’images dispose désormais d’un espace dédié, disponible en cliquant sur « Images » dans le menu de gauche du chatbot. Sam Altman, le patron d’OpenAI, fait d’ailleurs le buzz depuis qu’il a publié un exemple de ChatGPT Images, où il s’est transformé en pompier…

Un éditeur d’images perfectible

Sur le billet de blog, OpenAI présente de nombreux exemples des améliorations. L’outil est bien plus performant lorsqu’il s’agit d’éditer les images, notamment de fusionner les éléments de plusieurs images en une seule, d’ajouter de nouveaux éléments, ou encore d’éditer certains détails en particulier. La firme indique qu’il suit mieux les instructions, et améliore la prise en charge du texte, notamment pour les petits caractères ou les paragraphes denses.

Toutefois, OpenAI met en garde sur les limites du nouveau modèle. Il présente toujours des erreurs dans le domaine scientifique, mais moins qu’auparavant, et a quelques difficultés pour le texte multilingue, notamment lorsqu’il s’agit du chinois, de l’arabe ou de l’hébreu. Enfin, sur une photo avec beaucoup de personnes, il lui arrive de mélanger les visages s’il doit les éditer, et il a même régressé dans la génération avec certains styles (l’exemple donné est « dark fantasy anime »). GPT-Image-1.5 est disponible gratuitement pour tous les utilisateurs et remplace l’ancien modèle, qui est toujours disponible sous la forme d’un GPT personnalisé, ce qui permet de comparer les deux.

Leave a Reply

Your email address will not be published. Required fields are marked *