Google relance la génération d'images IA sur Gemini avec Imagen 3 après suspension

Gemini AI : Google relance à nouveau la génération des images de personnes après une période de suspension

Manuel Lodjo
6 min de lecture
Google réactive la génération d'images sur Gemini avec Imagen 3, apportant des visuels plus réalistes et des filtres de sécurité renforcés.

Google relance la génération d’images sur Gemini avec Imagen 3 et nouvelles mesures de sécurité

Google a récemment annoncé qu’il a l’intention de relancer la création d’images de personnes sur Gemini. La décision intervient après plusieurs mois de suspension suite à la polémique engendrée par les dysfonctionnements de l’ancien générateur d’images intégré à son assistant IA. 

La controverse des représentations historiques problématiques

En février 2024, Google a dû désactiver la génération d’images sur Gemini. Cette décision faisait suite à de nombreuses critiques d’utilisateurs qui avaient remarqué des anachronismes flagrants dans les images produites par l’agent conversationnel.

Parmi les exemples les plus frappants, on peut citer :

  • Des légions romaines composées de soldats aux origines ethniques diverses
  • Des représentations stéréotypées de guerriers zoulous

En gros, l’IA de Google produisait des visuels ne correspondant pas à la réalité historique1 et peinait à représenter correctement la diversité humaine. 

En plus, certaines images générées renforcaient des clichés ethniques.

Ces inexactitudes ont mis en lumière les limites du modèle et la nécessité d’une refonte en profondeur. 

La controverse a temporairement écorné l’image de Google qui a dû réagir rapidement pour ne pas davantage perdre la face en promettant qu’un correctif2 devrait arriver « très rapidement ».

Le retour de la génération d’images de personnes sur Gemini

Après des mois d’attente, la firme de Mountain View a décidé de retenter l’expérience. Pour ce fait, il a choisi de tout miser sur Imagen 3, la dernière version de son générateur d’images IA, initialement déployée sur Vertex AI3

Actuellement en cours d’ intégration sur Gemini, cette version améliorée du modèle text-to-image de Google se distingue par :

  • Une meilleure qualité d’image globale
  • Une compréhension plus fine des requêtes textuelles
  • Des images plus créatives et détaillées

Comme l’a dit Google4 lui-même:

« Imagen 3 établit une nouvelle norme en matière de qualité d’image, en générant des images avec seulement quelques mots. Vous pouvez même demander à Gemini de créer des images dans différents styles, comme des paysages photoréalistes, des peintures à l’huile texturées ou des scènes fantaisistes en pâte à modeler. »

Nouvelles mesures de sécurité pour éviter les erreurs du passées

Pour éviter les dérives potentielles liées à la génération d’images contenant des personnes, Google a renforcé les filtres de sécurité5 dans Imagen 3 :

  • Interdiction de générer des individus identifiables : Pas de création de faux portraits de personnes réelles.
  • Protection des mineurs : Impossibilité de générer des images d’enfants.
  • Filtrage des contenus sensibles : Blocage automatique des scènes violentes ou sexuellement explicites.
  • Système de tatouage numérique SynthID :  Application d’un filigrane invisible aux images générées par l’IA pour les identifier facilement.

Un déploiement progressif et contrôlé

Pour revenir dans la course aux côtés de concurrents redoutables comme Bing Image Creator Image, Grok de xAI, Dall-E 3 d’OpenAI, Google a décidé de jouer la carte de la prudence.

Le déploiement de la fonctionnalité « génération d’image de personnes » se fait progressivement.

Dans un premier temps, seuls les abonnés aux offres payantes Gemini Advanced, Business et Enterprise peuvent y accéder. 

Cette phase de test permettra à Google de collecter les retours des premiers utilisateurs. L’entreprise pourra ainsi ajuster le modèle si nécessaire, afin d’éviter que les problèmes rencontrés précédemment ne se reproduisent.

Questions fréquentes sur le sujet 

Puis-je générer des images avec Gemini ?

Oui, il est possible de générer des images avec Gemini. Google a récemment réactivé cette fonctionnalité après une période de suspension.

Pourquoi Gemini ne peut plus générer d’images ?

Gemini a temporairement suspendu la génération d’images en février 2024 après des controverses concernant des représentations historiques incorrectes et des stéréotypes ethniques. Google a décidé d’améliorer le modèle avant de relancer cette fonctionnalité.

Comment générer des images avec Gemini ?

Pour générer des images avec Gemini, les utilisateurs doivent avoir accès à la version payante de l’IA. Une fois connectés, ils peuvent entrer leurs prompts qui seront transformés en images par le modèle Imagen 3, désormais intégré à Gemini.

Qui peut générer des images de personnes sur Gemini ?

 Actuellement, seuls les abonnés aux offres payantes Gemini Advanced, Business, et Enterprise ont accès à la fonctionnalité de génération d’images de personnes

Relance de la génération d’images de personnes sur Gemini : Une 2e chance pour Google

Google réintroduit prudemment la génération d’images de personnes dans son IA Gemini. Après avoir appris de ses erreurs, le géant californien mise sur Imagen 3 et promet des images plus précises et respectueuses de la vie privée. Ce lancement progressif permet d’améliorer le système tout en répondant aux défis éthiques. 

Avec cette relance, Google cherche à renforcer sa position sur le marché des générateurs d’images intégrés tout en adoptant une approche plus responsable.

Reste à voir si ces efforts sauront convaincre les utilisateurs.


Références

  1. Gemini : Google s’explique après les anomalies de son générateur d’images. BDM, du 26 février 2024. Consulté le 3 septembre 2024. ↩︎
  2. Google says it’s fixed Gemini’s people-generating feature. TechCrunch, du 28 Août 2024. Consulté le 3 septembre 2024. ↩︎
  3. Google’s Imagen 3 text-to-image foundation model comes to Vertex AI. VentureBeat, du 27 juin 2024. Consulté le 3 septembre 2024. ↩︎
  4. New in Gemini: Custom Gems and improved image generation with Imagen 3. Blog Google, du 28 Août 2024. Consulté le 3 septembre 2024. ↩︎
  5. Google Relaunches AI Image Creation With New Safeguards. Search Engine Journal, du 29 Août 2024. Consulté le 3 septembre 2024. ↩︎
Partagez cet article