OpenAI renforce sa crédibilité avec l'accord de données

OpenAI enfin prêt à payer pour les données de formation de ChatGPT

Dernière mise à jour : 4 novembre 2024 17h08

De Manuel Lodjo 1

8 min de lecture

OpenAI investit des millions pour l'accès aux données de formation de ChatGPT et renforce ses performances

Surprenant, mais vrai. OpenAI offre de payer des dizaines de millions d'euros afin d'accéder légalement à leurs données pour la formation de ChatGPT. Le fait que ChatGPT montre un ralentissement de ses performances depuis quelques mois n'y est peut-être pas étranger.

Dans cet article, vous découvrirez l'ampleur de l'enjeu de cette entente pour OpenAI, et comment l'entreprise compte faire de ses ennemis d'hier, ses alliés d'aujourd'hui.

Qu'est-ce que les données de formation pour une IA?

Les données de formation d'une IA sont celles qui sont identifiées et préparées pour son développement. Le Machine Learning permet à l'IA d'extraire des informations appropriées pour son apprentissage au milieu d'un lot d'informations complexes.

Pourquoi les données de formation de l'IA sont-elles importantes ?

Les données de formation façonnent l'IA pour qu'elle réalise correctement ses tâches. Elles servent également à en corriger les éventuels bugs et à renforcer ses capacités.

Quels problèmes ce contrat résoudra-t-il ?

OpenAI a fermement l'intention de changer le monde avec l'IA. Cependant, son action envers les médias n'est pas bénévole. Plusieurs événements malheureux ont conduit l'entreprise à mettre de l'eau dans son vin, principalement :

La vendetta des auteurs et des médias : de plus en plus active, l'opposition des auteurs et des médias contre la razzia de leurs œuvres se présente sous plusieurs formes (protestations, blocus,…)
Les hallucinations : ce problème n'est pas encore définitivement résolu. L'IA invente au lieu de produire une réponse correcte
Les brèches de sécurité : ChatGPT déraille face à des attaques simples et a parfois dévoilé ses données d'entraînement ainsi que des données personnelles sensibles

Ces difficultés étaient relativement maîtrisées, jusqu'à ce que ChatGPT montre des signes d'essoufflement. ChatGPT serait devenu stupide depuis un trimestre, entraînant une baisse d'audience, donc de revenus. Plusieurs théories se proposent d'expliquer ce phénomène :

Une insuffisance des données d'entraînement : les créateurs et les médias ne relâchent pas la pression : Microsoft et OpenAI viennent d'être traînés tout récemment en justice par Le New York Times pour une violation d'auteur présumée¹. Le premier pour l'utilisation du contenu du New York Times pour former Copilot², et le second pour ChatGPT. Plus tôt, un blocus orchestré a privé ChatGPT d'accès aux informations actualisées. Des créations permettent d'empoisonner une IA qui “plonge la main dans le plat” et subtilise leurs contenus sans autorisation
Une dépression saisonnière : à force d'anthropisation de l'outil, certains voient en ses baisses de capacités, une reproduction exacte du comportement humain pendant la période hivernale.
Une perte de contrôle : les ingénieurs de OpenAI sont incapables d'expliquer certaines réactions de l'IA suites à ses interactions avec le monde réel

Les lourds investissements de OpenAI n'ayant pas pu résoudre ces problèmes, il était temps de prendre le cas par l'autre manche.

Quels sont les termes du contrat proposé par OpenAI ?

L'information a été publiée pour la première fois par le Wall Street Journal³. Élaborée dans une optique de partenariat gagnant-gagnant, les termes de l'entente, qui est prévue pour 03 ans, n'ont pas été dévoilés⁴.

OpenAI propose de rémunérer l'éditeur allemand Springer pour l'accès de ChatGPT à leurs contenus. Maintenant que ChatGPT n'est plus limité à l'année 2021, son accès à une information de qualité en temps réel est devenu un enjeu vital pour sa compétitivité.

Que gagnent les parties ?

Ce que gagne OpenAI

Une crédibilité renforcée
L'accès aux contenus actuels et archivés de l'éditeur pour l'entraînement de ses modèles d'IA
Les contenus comprennent entre autres, ceux de Business Insider, Bild, Politico ou Welt.

Ce que gagne l'éditeur

Une manne de dizaines de millions d'euros et l'élaboration de nouveaux modèles de revenus
Un lien direct vers l'éditeur, indiquant la source de l'information en toute transparence
L'accès à l'expertise technologique de OpenAI pour l'amélioration de ses propres offres

Plus discrètement, OpenAI avait déjà annoncé l'accord d'une licence à l'agence de presse Associated Press⁵ pour la formation de ses modèles. Le rapprochement actuel avec Springer pousse l'expérience plus loin.

Quelles sont les questions fréquentes au sujet de ChatGPT ?

Quel est le plus grand espoir suscité par le lancement de ChatGPT ?

ChatGPT ouvre une ère technologique nouvelle concernant l'usage du web et de la technologie. Même si l'IA imite l'être humain, elle est entraînée pour parvenir progressivement à dépasser et anticiper ses capacités.

Quelles sont les pires craintes au sujet de l'IA ?

L'IA a suscité de nombreuses craintes depuis son lancement, parmi lesquelles : le chômage massif, la prolifération des fake news et la perte de contrôle par ses créateurs.

Comment sont les relations entre OpenAI, les auteurs et les médias ?

Jusqu'à maintenant, les relations entre OpenAI, les auteurs et les médias sont scabreuses. L'initiative récente de OpenAI envers l'éditeur Axel Springer doit envoyer un message d'apaisement.

Pourquoi n'éteint-on pas tout simplement l'IA, vu toutes les controverses qu'elle suscite ?

Jusqu'à présent, l'IA présente plus d'espoir que de craintes. Les chômeurs occasionnés par l'IA sont relativement peu nombreux, et le législateur a commencé à fixer un cadre, tel que l'UE Act. Ses créateurs en améliorent progressivement les performances pour un meilleur rendu.

Que faut-il retenir ?

OpenAI propose d'acheter les données de formation de ChatGPT auprès des médias. Surprenant pour les uns, mais prévisible pour les autres. Logiquement, OpenAI ne pouvait pas continuer durablement à faire son lit sur le dos des auteurs et des médias.

OpenAI va rémunérer l'éditeur Axel Springer pour accéder à ses contenus
Grâce à cette entente, elle pourra corriger les récentes défaillances de ChatGPT
Springer reçoit en retour une licence exclusive de OpenAI
Les détails de l'entente n'ont pas été révélés

Apparemment, la démarche de OpenAI fait des émules. Microsoft s'est engagé à renforcer le trafic vers les éditeurs ainsi que leurs revenus, grâce à sa technologie d'IA via Copilot, Bing ou Edge.

La solution du bon sens est la dernière à laquelle songent les spécialistes
Bernard Grasset

Nous dit Bernard Grasset. Et il dit vrai. OpenAI fait un pas vers ses adversaires d'hier pour redorer son blason et pérenniser ses profits. Seulement, aura-t-il l'effet escompté ?

Références :