OpenAI : Dépôt de marque pour Voice Engine et prévoit GPT-5 à GPT-7: Enjeux et Implications

Nicolas Chaudhary
De Nicolas Chaudhary 6 min de lecture
6 min de lecture

OpenAI a déposé une demande de marque pour créer des “assistants vocaux numériques” et un “moteur vocal”

OpenAI tourne à plein régime actuellement. La startup a déposé une demande de marque pour Voice Engine (ingénieur vocal), afin de créer des “assistants vocaux numériques” et un “moteur vocal”. En un laps de temps réduit, elle a lancé Sora AI, finalisé sa nouvelle IA et projette déjà GPT-5 (été 2024), GPT-6 et GPT-7.

Dans cet article, vous découvrirez les enjeux derrière cette apparente hyperactivité foisonnante.  

Que contient la demande de marque pour Voice Engine (ingénieur vocal) de OpenAI ?

Selon Business Insider, les logiciels figurant sur la demande de marque de Voice Engine (ingénieur vocal) couvrent les domaines suivants :

  1. Créer des assistants vocaux numériques
  2. Reconnaissance vocale et sonore, traitement des commandes vocales et conversion entre texte et parole
  3. Traitement des commandes vocales et conversion entre texte et parole
  4. reconnaissance et génération automatiques de la parole et de la voix
  5. Générer des sorties vocales et audio basées sur des invites en langage naturel, du texte, de la parole, des invites visuelles, des images et/ou des vidéos
  6. Génération d’audio et/ou de voix en réponse aux invites de l’utilisateur
  7. Traitement du langage naturel et de la parole basé sur l’apprentissage automatique
  8. Reconnaissance vocale, traduction et transcription multilingues
  9. Utilisation de l’intelligence artificielle pour la conversion automatique de texte en voix et de texte en audio
  10. Développement de la prestation de services vocaux

En attendant l’accord du législateur, OpenAI a pris de l’avance et finalisé Voice Engine (Ingénieur vocal), puis l’a gardé bien au chaud. 

Quels sont les enjeux de la demande de marque pour Voice Engine ?

La demande de marque pour Voice Engine est stratégique1. Elle signe une intervention de plus en plus fréquente des assistants IA dans le quotidien des utilisateurs. 

En couvrant une panoplie étendue de technologies liées à la voix, OpenAI se positionne comme concurrent direct des champions Amazon pour Alexa, Apple pour Siri et Google pour Google Assistant. 

Quelles sont les caractéristiques de Voice Engine, la nouvelle technologie de OpenAI ?

Son rôle

Voice Engine peut cloner la voix humaine avec 15 secondes d’enregistrement. Cette suite technologique servira à créer des assistants vocaux IA capables de :

  • Générer de l’audio à partir de prompts textuels
  • La reconnaissance vocale
  • Traiter les commandes vocales
  • Traduire plusieurs langues

Voice Engine s’appuie sur l’API de synthèse vocale et le modèle de reconnaissance vocale Whisper, les technologies IA existantes de OpenAI. A terme, Voice Engine pourrait offrir des services spécialisés aux entreprises. 

Les risques

Le risque majeur de Voice Engine tient à son utilisation frauduleuse. En pleine année électorale, aucun hacker n’oserait cracher sur l’opportunité dorée de reproduire les voix des candidats pour des desseins inavouables. En effet, les appels automatisés envoyés au nom du président Joe Biden2, ont laissé une impression forte, et font l’objet d’une enquête. 

Nous reconnaissons que générer un discours qui ressemble à la voix du peuple comporte de sérieux risques, qui sont particulièrement importants en période d’élections.3

Communiqué de OpenAI

En même temps, OpenAI n’est pas la première startup à s’aventurer dans ce domaine. En effet, les professionnels et les usagers y ont accès. 

Le dispositif de sécurité

Avant : les tests

OpenAI testera prochainement sa nouvelle technologie. Les testeurs s’engagent à informer de l’utilisation d’une IA, et n’auront pas le droit d’usurper les identités. 

Les autres précautions concernant Voice Engine

Dans l’immédiat, Voice Engine ne sera pas publié. Ce n’est pas la première fois que OpenAI procède avec modération. Par exemple, Sora a été lancée sur un principe similaire4

OpenAI souhaite faire les choses bien

Une demande en règle et des projets ambitieux. Par contre, rien n’est acquis, vu les réserves de l’Office américain des brevets et des marques concernant l’octroi de la licence à OpenAI pour l’acronyme GPT.

  • OpenAI a déposé une demande de marque pour Voice Engine
  • Il s’agit d’une technologie pour concevoir des assistants vocaux basés sur l’IA
  • Avec cette nouvelle technologie, OpenAI confronte directement Apple, Google et Amazon sur le marché des assistants vocaux IA
  • Les risques de fraudes à l’utilisation sont élevés
  • Par prudence, OpenAI ne va pas déployer sa technologie dans l’immédiat

Gandhi affirme que “La plus petite des actions vaudra toujours mieux que la plus grande des intentions.” Et dans les dans les faits, OpenAI affiche un dynamisme qui, espérons-le, lui portera bonheur.  


Références

  1. OpenAI sets sight on voice Assistant market with new voice engine trademark, Marktechpost. Publié le 26 mars 2024. Consulté le 27 mars 2024. ↩︎
  2. OpenAI tech clone someone voices safety concerns, Fortune. Publié le 30 mars 2024. Consulté le 30 mars 2024. ↩︎
  3. OpenAI voice assistant : voice cloning safety concerns, Global News. Publié le 29 mars 2024. Consulté le 29 mars 2024. ↩︎
  4. OpenAI reveals voice engine, Yahoo finance. Publié le 29 mars 2024. Consulté le 29 mars 2024. ↩︎
Partagez cet article