OpenAI : le déploiement du mode vocal avancé de ChatGPT reporté à plus tard

OpenAI : le déploiement du mode vocal avancé de ChatGPT reporté à plus tard

Nicolas Chaudhary
De Nicolas Chaudhary 7 min de lecture
7 min de lecture
OpenAI reporte le mode vocal de ChatGPT pour raisons de sécurité

OpenAI retarde le mode vocal de ChatGPT pour sécurité et performances renforcées

OpenAI joue la carte de la prudence en reportant la sortie du mode vocal amélioré de ChatGPT pour raisons de sécurité. Une décision stratégique laisse le temps à la société d’IA d’effectuer des tests supplémentaires et d’améliorer la fonctionnalité avant de la déployer.

Plus de détails sur les raisons de ce report et ses implications.

Un lancement initialement prévu pour juin 2024

Présenté en mai dernier au même moment que GPT-4o, la commande vocale avancée de ChatGPT avait suscité un vif intérêt.

OpenAI promettait une expérience de conversation presque humaine, avec une compréhension fine des émotions et des signaux non verbaux.

Le déploiement était normalement prévu pour fin juin auprès d’un groupe restreint d’utilisateurs de ChatGPT Plus.

Malheureusement, l’entreprise a dû se résoudre à le remettre pour plus tard face à des « défis techniques persistants ».

Pourquoi ce retard : les raisons expliquées par OpenAI

Des problèmes techniques et de sécurité1 doivent être résolus en premier lieu, en particulier pour améliorer la détection et le rejet de contenus inappropriés. 

Ensuite, l‘infrastructure doit être renforcée pour gérer des millions de requêtes en même temps, sans aucun retard. Cela implique de préparer les serveurs et de mettre en place des systèmes capables de répondre instantanément sans délai.

Un report stratégique pour garantir sécurité et fiabilité

OpenAI insiste sur sa volonté de proposer ces nouvelles expériences « de manière réfléchie ». C’est pour cela qu’une stratégie de déploiement en plusieurs étapes a été adoptée.

L’entreprise a l’intention de commencer par une phase pilote avec un petit échantillon d’utilisateurs afin d’obtenir des retours pour améliorer le système en conséquence.

Un nouveau calendrier incertain

Le lancement grand public du mode vocal amélioré sera probablement programmé pour l’automne 20242, selon les résultats des contrôles internes de sécurité et de fiabilité.

OpenAI garde une attitude prudente :

les délais exacts dépendent de notre capacité à atteindre nos normes élevées de sécurité et de fiabilité .

Cette prudence montre que la société dirigée par Sam Altman aspire à offrir une technologie responsable et maîtrisée.

L’impact du report

Malgré ce contretemps, OpenAI maintient le cap sur d’autres innovations. Le déploiement des nouvelles fonctionnalités de partage de vidéo et d’écran se poursuit comme prévu. Ces outils permettront notamment de résoudre des problèmes mathématiques à partir d’images ou d’expliquer des menus de paramètres sur différents appareils.

Réactions des utilisateurs de ChatGPT Plus

Le report du mode vocal a suscité des réactions mitigées parmi les utilisateurs de ChatGPT Plus. Beaucoup ont exprimé leur déception et certains envisagent même l’annulation3 de l’abonnement premium à cause du retard pris pour la nouvelle fonctionnalité annoncée.

Mode vocal avancé de ChatGPT : une fonctionnalité prometteuse mais controversée

Qu’est-ce que le mode vocal avancé de ChatGPT?

Le mode vocal avancé de ChatGPT est une fonctionnalité qui permet aux utilisateurs d’interagir avec l’IA via la voix. Il est conçu pour « comprendre et répondre aux émotions et aux signaux non verbaux », rendant les interactions plus naturelles et intuitives. Il s’agit tout simplement d’une version avancée de la commande vocale actuelle de ChatGPT4.

Les capacités prévues

  • Performance améliorée : Cette fonctionnalité promet d’être plus rapide et plus performante que la commande vocale existante.
  • Reconnaissance d’images : Le mode vocal intègre la reconnaissance d’images pour des interactions plus naturelles et dynamiques.
  • Réponses rapides : Lors de la présentation, les employés d’OpenAI ont démontré la capacité de l’assistant vocal à répondre presque instantanément à des demandes.
  • Résolution de problèmes : Un exemple concret a été montré où l’assistant a pu résoudre un problème mathématique présenté sur une feuille de papier placée devant la caméra d’un smartphone.

La controverse autour de la voix de Scarlett Johansson

Le mode vocal avancé de ChatGPT a déjà fait l’objet d’une polémique concernant la similitude de sa voix par défaut avec celle de l’actrice Scarlett Johansson. Cette dernière a même menacé de poursuivre l’entreprise. Finalement OpenAI a supprimé la voix « Sky » et son retour reste incertain.

Questions fréquentes sur le sujet

Quand le mode vocal de ChatGPT sera-t-il finalement disponible ?

OpenAI n’a pas communiqué de date précise pour le lancement grand public du mode vocal. L’entreprise évoque une possible disponibilité à l’automne 2024, sous réserve que la fonctionnalité réponde à tous les critères de sécurité et de fiabilité.

Pourquoi OpenAI a-t-elle décidé de reporter le lancement du mode vocal ?

Le report est motivé par plusieurs facteurs : la nécessité d’améliorer la détection et le refus de contenus inappropriés, le perfectionnement de l’expérience utilisateur, et la préparation de l’infrastructure pour gérer un grand nombre d’utilisateurs tout en maintenant des performances optimales. OpenAI souhaite s’assurer que la technologie est sûre et fiable avant un déploiement à grande échelle.

Le report du mode vocal affecte-t-il d’autres fonctionnalités de ChatGPT ?

Non, le report ne concerne que le mode vocal avancé. Les autres fonctionnalités annoncées par OpenAI, comme le partage de vidéo et d’écran, ainsi que la capacité à résoudre des problèmes mathématiques à partir d’images, sont toujours en cours de déploiement selon le calendrier prévu.

Lancement assistant vocal ChatGPT reporté : OpenAI recule pour bien sauter

Ce report de la fonctionnalité  illustre le défi constant des entreprises d’IA : concilier innovation rapide avec garantie de sécurité et d’éthique.

Et cette fois, OpenAI semble privilégier une approche prudente, quitte à décevoir temporairement certains utilisateurs impatients.

Malgré ce retard, le lancement du mode vocal avancé marquera sans doute une étape importante dans l’évolution de ChatGPT.

En prenant le temps nécessaire pour surmonter les défis techniques et sécuritaires, OpenAI prépare donc le terrain pour une expérience utilisateur plus sûre et immersive.

Seul l’avenir nous dira si cette prudence paiera et si cette fonctionnalité tant attendue sera à la hauteur des attentes.


Références

  1. Publication OpenAI sur X, du 25 juin 2024. Consulté le 27 juin 2024.
    ↩︎
  2. OpenAI delays ChatGPT’s new Voice Mode. TechCrunch, du 25 Juin 2024. Consulté le 27 Juin 2024. ↩︎
  3. Post DreamingTulpa sur X, du 26 juin 2024. Consulté le 27 Juin 2024. ↩︎
  4. ChatGPT : la commande vocale est disponible gratuitement pour tous, comment l’utiliser. BDM, du 22 novembre 2023. Consulté le 27 juin 2024.
    ↩︎
Partagez cet article