Découvrez Gemini, concurrent affirmé de ChatGPT

David Licoppe
11 min de lecture

Gemini : Caractéristiques, différences avec Bard et ChatGPT, démarrer et riposte de OpenAI

Plus avancé, plus sécuritaire… les éloges ne manquent pas pour Gemini, la nouvelle IA de Google. Toutefois, le nouveau venu a également pour mission spécifique de faire disparaître ChatGPT. Mais concrètement :

Dans cet article, vous découvrirez les enjeux qui se cachent derrière le lancement orchestré de Gemini.   

Qu’est-ce que Gemini ?

Gemini signifie “Les Gémeaux” en français et a été présenté par Sundar Pichai durant la conférence d’E/S en juin. Gemini 1.01 est la nouvelle IA de Google, et la plus puissante de la firme de Mountain View à ce jour. Le nom “Gemini” fait également référence au projet homonyme de la NASA, qui a préparé les alunissages du programme Apollo.

Gemini : Expliquer le raisonnement en mathématiques et en physique

Gemini est l’aboutissement d’une décennie de recherches2, et a été élaboré par la division DeepMind de Google. Il valorise le mantra de Google “Audacieux et responsable”. Modèle évolutif, il est multisensoriel et développera sa conscience et ses compétences au fil du temps. Avec ce modèle, Google met en avant la sûreté, la gestion, la sécurité, la confidentialité et la conformité des données de l’entreprise3.

Pourquoi Gemini est-il important ?

Gemini appartient à Google, le leader mondial du web. Il est plus avancé que Bard. De plus, Gemini est la réponse tant attendue de Google face à OpenAI, un an après le lancement de ChatGPT4, et huit mois après celui de Bard. Gemini est potentiellement le modèle le plus rentable de tous les temps pour Google, s’il parvient à faire adopter son innovation via ses clouds pour professionnels.

Cette nouvelle ère de modèles représente l’un des plus grands efforts scientifiques et techniques que nous ayons entrepris en tant qu’entreprise (…)

Je suis vraiment enthousiasmé par ce qui nous attend et par les opportunités que Gemini offrira aux gens du monde entier.”

Sundar Pichai, PDG de Google

Il s’agit d’une guerre sans prisonniers et qu’il faut gagner.

Oren Etzioni, professeur émérite à l’Université de Washington et ancien PDG de l’Allen Institute for AI

Gemini a subi des tests de fiabilité internes et externes. Il comporte trois modèles spécifiques mais complémentaires :

  • Gemini Ultra : le concurrent direct de GPT-4 de OpenAI. C’est le modèle le plus puissant.
  • Gemini Pro : frontalement opposé à la version basique GPT-3.5 de OpenAI
  • Gemini Nano : plus léger, il est conçu pour les appareils mobiles. Il peut être exécuté de façon native hors ligne sur Android. 

Quelles sont les caractéristiques de Gemini ?

  • Un contrôle précis
  • Des images de haute définition
  • La diversité et la nouveauté des résultats générés
  • Deux réseaux de neurones génératifs antinomiques : l’un génère des images réalistes, et l’autre s’emploie à les distinguer des images réelles.

Quelles sont les différences entre Gemini et Bard ?

  • Bard possède des capacités de compréhension, de raisonnement et de planification moins puissantes que Gemini
  • Le fonctionnement de Bard est désormais basé sur une version optimisée de Gemini Pro
  • Une réduction significative des hallucinations5 pour Gemini
  • Gemini fournit un langage plus riche6
  • Bard se concentre sur l’automatisation, tandis que Gemini se concentre sur l’attractivité et la diversité
  • Bard utilise une technique d’apprentissage par renforcement, tandis que Gemini utilise les GAN (réseaux contradictoires génératifs)7 
  • Bard s’appuie sur un modèle d’application efficace , tandis que Gemini se concentre sur la créativité
  • Bard déploie du contenu prêt à l’emploi, tandis que Gemini répond aux exigences spécifiques
  • Bard évolue via la recherche de modèles plus avancés, tandis que Gemini se concentre sur la diversification et la haute résolution
  • Enfin, Gemini est mieux structuré que Bard et cite ses sources8

Quelles sont les différences entre Gemini et ChatGPT ?

Gemini a obtenu un score de plus de 90% au test MMLU (Massive Multitask Language Understanding). A en croire Google, Il possède des capacités supérieures à celles de ChatGPT 4. 

Gemini a été conçu dès le départ pour être multimodal. Il interagit mieux avec la vidéo et l’audio que les autres modèles actuels9. En conséquence, il est globalement mieux équipé que les créations de OpenAI plus spécialisées : 

  • ChatGPT pour la conversation
  • DALL-E pour les images
  • Whisper pour la voix

Gemini a montré une avance significative10 sur ChatGPT à plusieurs niveaux :

  • L’actualité des informations
  • L’étendue des tâches
  • La personnalisation
  • Le traitement des données11
  • La créativité
  • Les performances
  • La quantité des tâches
  • La capacité d’apprentissage
  • L’interactivité
  • Le développement progressif des capacités
  • Les techniques employées
  • L’architecture : unimodale pour ChatGPT et multimodale pour Gemini
  • Les capacités de ChatGPT sont acquises, tandis que celles de Gemini sont natives12

Comment démarrer avec Gemini ?

Pour les développeurs

  • Via Google AI Studio ou Google Cloud Vertex AI pour les entreprises (Gemini Pro)
  • Via AICore dans Android 14 (Gemini Nano)

Pour les entreprises

  • L’identification des tendances pour la publicité
  • Les recommandations de produits
  • La création de contenu
  • Les chatbots
  • L’analyse de données en temps réel13
  • Le rééquilibrage des risques de confidentialité
  • La rédaction des codes pour les sociétés non technologiques
  • Les applications de productivité
  • La contribution à la recherche scientifique 

Pour le grand public

Google (Alphabet) a lancé la première phase de Gemini le 06 décembre14 dernier. Il est déjà disponible sur les téléphones Bard et Pixel 8 Pro de Google, sous quelques conditions.

Pour le Pixel 8 Pro : Gemini alimente la fonction Résumer dans le Recorder d’Android. Elle sera disponible pour la fonction Smart Reply de Google uniquement dans WhatsApp, si et seulement si vous possédez le clavier de Google.

Gemini sera également accessible dans plusieurs services actuels de Google, tels que la Search Generative Experience15, Chrome et Ads, d’ici l’an prochain.

Aussi, une version payante est en cours de finalisation. Dénommée Bard Advanced, elle fonctionnera sur Gemini Ultra. Les tarifs seront disponibles ultérieurement. 

Malgré la promesse initiale16, le lancement du bolide, qui a pour l’instant du mal avec les requêtes multilingue, a été repoussé au début de 2024. A terme, Gemini sera intégré au moteur de recherche de Google. 

Quelle est la riposte de OpenAI face à Gemini ?

Pas de riposte, OpenAI a plutôt misé sur l’anticipation. Depuis novembre, des rumeurs affirment qu’une prochaine édition d’IA serait plus proche de l’AGI (Intelligence Générale Artificielle)17. Le modèle, tenu secret, s’appelle “Q” ou “Q-Star”, selon les sources. 

Q serait capable de répondre à des questions mathématiques basiques, une avancée notable comparée aux LLM existants. Ces informations circulent alors que Google n’a pas confirmé avoir atteint ce niveau de compétence avec Gemini. Quoi qu’il en soit, Gemini pourrait constituer l’étape la plus importante de l’histoire de Google depuis le lancement de PageRank.

Quelles sont les questions fréquentes à ce sujet ?

Comment fonctionne Gemini ?

En général, Gemini exécute les mêmes tâches que ChatGPT 4. Plus développé, son fonctionnement est basé sur le système de génération de code AlphaCode 2. Gemini a bénéficié d’une formation à la fois plus abordable et plus efficace que ses prédécesseurs, tels que PaLM. 

Quelle est la mission de Gemini ?

Le modèle d’IA le plus avancé en laboratoire est le Gemini Ultra. Au-delà des facilités pour la suite des services de Google, Gemini a pour mission de battre OpenAI dans la course technologique. C’est une étape dans la prochaine domination de Google sur le marché technologique.

Quelle est l’offre de Gemini pour les professionnels ?

Pour le moment, les professionnels accéderont à Gemini Pro via Google AI Studio ou Google Cloud Vertex AI. Ils pourront également utiliser Gemini Nano via AICore dans Android 14. Google distribuera des licences pour une utilisation personnalisée des fonctions de Gemini. 

Quelle est l’offre de Gemini pour le grand public ?

Gemini est déjà disponible sur les téléphones Bard et Pixel 8 Pro de Google. Les utilisateurs le trouveront également dans le chatbot Bard, et chaque fois qu’ils utiliseront la Search Generative Experience. Google a travaillé sur la factualité de Gemini. Par conséquent, les utilisateurs rencontreront moins d’hallucinations pendant l’utilisation. 

Gemini redessine-t-il la carte de l’IA ?

Issue d’une recherche approfondie de la part de Google, l’IA Gemini pourrait redessiner la carte de l’IA dans le monde. Google s’apprête définitivement à croiser le fer avec OpenAI pour les futures intelligences artificielles. 

  • Multimodalité
  • Plus de factualité18
  • Moins d’hallucinations
  • De meilleures performances

“L’espoir fait vivre”, entend-on dire souvent. Et face au géant Google qui a décidé de tout balayer sur son passage, d’espoir et d’inventivité, la startup OpenAI aura grand besoin. Le géniteur de ChatGPT va-t-il se retrouver sur la défensive ? Après tout, au-delà des comparatifs technologiques, le verdict final entre les deux colistiers sera donné par les utilisateurs, humains.


Références :

  1. Google launches Gemini, its most-advanced AI model yet, as it races to compete with ChatGPT, CNN Business. Publié le 06 décembre 2023. Consulté le 17 décembre 2023. ↩︎
  2. Google launches Gemini, the AI model it hopes will take down GPT-4, The Verge. Publié le 06 décembre 2023. Consulté le 17 décembre 2023. ↩︎
  3. Introducing Gemini: our largest and most capable AI model, Google The Keyword. Publié le 06 décembre 2023. Consulté le 17 décembre 2023. ↩︎
  4. Joyeux anniversaire, ChatGPT ! Le Devoir. Publié le 11 décembre 2023. Consulté le 17 décembre 2023. ↩︎
  5. Google Just Launches Gemini, Its Long-Awaited Answer to ChatGPT, Wired. Publié le 06 décembre 2023. Consulté le 17 décembre 2023. ↩︎
  6. Le nouveau Bard avec Gemini est-il plus performant ? Le Journal du Net. Publié le 14 décembre 2023. Consulté le 17 décembre 2023. ↩︎
  7. Unveiling the Differences between Google BARD and Gemini: A Comparative Analysis, Medium. Publié le 07 juin 2023. Consulté le 17 décembre 2023. ↩︎
  8. On a posé 8 questions à Google Bard avec Gemini 1.0: voici ses réponses, 01net. Publié le 07 décembre 2023. Consulté le 17 décembre 2023. ↩︎
  9. Gemini vs ChatGPT : Cointelegraph teste les modèles d’IA de Google et OpenAI, Cointelegraph. Publié le 08 décembre 2023. Consulté le 17 décembre 2023. ↩︎
  10. Gemini vs ChatGPT: Which is better? Hgs. Publié le 18 décembre 2023. Consulté le 19 décembre 2023. ↩︎
  11. OpenAI ChatGPT vs. Google Gemini : Next-Gen AI Showdown 2024, RedBlink. Publié le 14 décembre 2023. Consulté le 17 décembre 2023. ↩︎
  12. Différences clés entre Gemini et ChatGPT, AppMaster. Publié le 11 décembre 2023. Consulté le 17 décembre 2023. ↩︎
  13. Google’s Gemini AI hints at the next great leap for the technology: analysing real-time information, The Conversation. Publié le 11 décembre 2023. Consulté le 17 décembre 2023. ↩︎
  14. Google Launches New Multi-Modal Gemini AI Model, InfoQ. Publié le 11 décembre 2023. Consulté le 17 décembre 2023. ↩︎
  15. Google launches its largest and ‘most capable’ AI model Gemini, CNBC. Publié le 06 décembre 2023. Consulté le 17 décembre 2023. ↩︎
  16. Google retarde sa riposte contre ChatGPT au dernier moment, numerama. Publié le 04 décembre 2023. Consulté le 17 décembre 2023. ↩︎
  17. OpenAI researchers warned board of AI breakthrough ahead of CEO ouster, sources say, Reuters. Publié le 23 novembre 2023. Consulté le 17 décembre 2023. ↩︎
  18. Google’s Gemini AI launches to the public, with search engine on the way: « We made a ton of progress in what’s called factuality ‘, Fortune. Publié le 07 décembre 2023. Consulté le 17 décembre 2023. ↩︎
Partagez cet article