Le clash entre OpenAI et ByteDance

Lionel Honou
De Lionel Honou 6 min de lecture
6 min de lecture

Conflit OpenAI vs ByteDance : Usage des données ChatGPT pour le Chatbot rival

Le torchon brûle entre OpenAI et ByteDance. La compagnie-mère de l’application éponyme TikTok aurait utilisé les données de ChatGPT pour former un chatbot rival.

Dans cet article, vous découvrirez dans quel contexte explosif ces événements se sont déroulés. Vous apprendrez également comment ByteDance a pu s’y prendre et enfin, de quels leviers OpenAI s’est servie pour contrer la manœuvre indélicate.   

Dans quel contexte se sont déroulés ces événements ?

Une guerre froide fait rage actuellement dans le monde technologique : il s’agit de passer leader de l’IA. Partie pionnière, la Chine s’est faite tacler en beauté par OpenAI avec le lancement de ChatGPT. L’écart vient de se creuser entre l’est et l’ouest avec la présentation de Sora, l’IA texte-vidéo de OpenAI en février 2024.

Ces événements se déroulent fin 2023. Le gouvernement américain exige que ByteDance vende ses parts dans TikTok si elle souhaite implanter durablement son application sur son territoire, étant donné sa présumée proximité géopolitique1 avec le gouvernement chinois. Le motif invoqué est l’accès élargi aux données personnelles des américains.

La Chine mobilise activement ses chercheurs pour trouver une parade à ChatGPT, et OpenAI n’a pas encore révélé au monde sa création Sora AI…

En quoi consistait la manœuvre de ByteDance dans ChatGPT ?

Selon The Verge, ByteDance a utilisé ChatGPT pour former un grand modèle de langage (Large Language Models, LLM) natif. Le modèle de ByteDance, rival de ChatGPT, s’appellerait “Project Seed”. 

ByteDance a reconnu les faits. Si The Verge affirme que ChatGPT a été utilisé dans la majorité des étapes de construction du nouveau bot, ByteDance admet s’en être servi pour “annoter le modèle”2. La firme de Pékin affirme avoir ensuite supprimé toutes les données issues de ChatGPT de son programme. Cependant, des communications internes3 de ByteDance révèlent que des manœuvres d’effacement des preuves ont également été pratiquées en toute discrétion. 

Désormais, qu’arrivera-t-il à ByteDance ?

Pour riposter à l’action de ByteDance, OpenAI a pris 2 décisions : la suspension immédiate du compte de ByteDance et une enquête approfondie. 

La suspension immédiate du compte de ByteDance

L’action de ByteDance a violé la licence de développeur de Microsoft et OpenAI,  à laquelle doivent adhérer tous les utilisateurs de ChatGPT. La sanction fut immédiate : 

Nous établissons (…) des normes et fournissons des ressources pour aider nos clients à utiliser ces technologie de manière responsable et conformément à nos conditions de service, et avons mis en place des processus pour détecter les utilisations abusives et interrompre l’accès4 si les entreprises violent notre code de conduite. (…) Bien que l’utilisation de notre API par ByteDance soit minime, nous avons suspendu leur compte (…)

Un porte-parole de OpenAI

Une enquête approfondie

OpenAI reconnaît que l’intervention de ChatGPT dans la formation de Project Seed est minime. Toutefois, une enquête approfondie est en cours pour entre autres, situer les responsabilités, et protéger à long terme l’intégrité des données de ChatGPT.

(…) Nous approfondissons notre enquête. Si nous découvrons que leur utilisation ne respecte pas ces politiques (de Microsoft et OpenAI ndlr), nous leur demanderons d’apporter les modifications nécessaires ou de résilier leur compte.

Un porte-parole de OpenAI

Microsoft, investisseur très engagé avec OpenAI, soutient toutes ses décisions.

Les questions fréquentes sur le sujet

Comment le capital de TikTok est-il réparti ? 

* 20% pour les fondateurs
* 20% pour les salariés
* 60% pour ByteDance  

Quelles sont les origines des craintes du législateur américain à l’égard de TikTok ?

TikTok a propagé du contenu antisémite et anti-israélien. De plus, le parti communiste chinois dispose d’un accès suprême aux données de ByteDance, y compris celles hébergées aux États-Unis via TikTok. 

Quel est l’utilisation officielle de ChatGPT accordée à l’origine par OpenAI à ByteDance ?

ByteDance utilise les API ChatGPT. En particulier, Duobao, qui est disponible uniquement en Chine, utilise les API ChatGPT pour fonctionner.   

Si l’infraction de ByteDance envers OpenAI est avérée après enquête, quelles seront les conséquences ?

Si les accusations contre ByteDance sont confirmées après l’enquête de OpenAI, plusieurs scénarios sont possibles :

* La perte définitive de l’accès à ChatGPT
* Le versement de dommages et intérêts à OpenAI
* Des barrières à l’entrée plus rigides, voire l’expulsion de ByteDance du territoire américain  

Pour les dominer tous

Par ce faux pas, ByteDance vient d’assumer ouvertement sa participation aux côtés de Baidu et Alibaba Group Holding, à la course technologique mondiale pour la domination de l’IA.

  • ByteDance a utilisé ChatGPT pour construire un chatbot rival nommé Project Seed
  • Une fois le pot-aux-roses découvert, ByteDance a reconnu les faits
  • OpenAI a rompu les liens avec ByteDance
  • Une enquête approfondie est en cours

Le législateur américain pourrait bondir sur l’occasion pour lui imposer des restrictions territoriales fortes. Cependant, le vin est tiré pour ByteDance et il faut le boire.   


Références :

  1. OpenAI Suspends ByteDance’s Account Over Use Of GPT For Training Its Own AI Model, NDTV World. Publié le 19 décembre 2023. Consulté le 11 mars 2024. ↩︎
  2. OpenAI suspends ByteDance’s access to ChatGPT after it reportedly violates usage terms, Technode. Publié le 18 décembre 2023. Consulté le 11 mars 2024. ↩︎
  3. OpenAI suspends ByteDance’s account over ‘secretly using’ its AI tech, Economic Times. Publié le 16 décembre 2023. Consulté le 11 mars 2024. ↩︎
  4. OpenAI suspends ByteDance’s account after it allegedly used GPT to build rival AI product: report, New York Post. Publié le 18 décembre 2023. Consulté le 11 mars 2024. ↩︎
Partagez cet article