Sora de OpenAI redistribue les cartes face à la Chine

David Licoppe

Impact de l’IA Sora sur le leadership technologique de la Chine et les restrictions américaines

Réputés pour leur ardeur au travail, les chinois pratiquent souvent le 9961, c’est-à-dire travailler de 9h du matin à 9h du soir, 6 fois par semaine. En concurrence serrée avec les États-Unis pour la technologie en général, les microprocesseurs et l’IA en particulier, l’Empire du Milieu vient pourtant de se faire damer le pion. OpenAI renforce sa position de leader avec le lancement de l’époustouflante IA texte-vidéo Sora. 

Dans cet article, vous apprendrez l’impact de l’avènement de Sora, à la fois sur le développement global de l’IA et sur la position stratégique de la Chine.  

Quelle est la place technologique de la Chine dans le paysage mondial ?

Les atouts technologiques de la Chine

La Chine a longtemps préservé sa posture de leader technologique mondial grâce à :

  • Une technologie faciale avancée
  • Des bases de données IA conséquentes

Malgré ces éléments, la progression de la Chine est entravée par de sévères restrictions.

Les limites technologiques de la Chine

Pour renforcer les performances de l’IA, la Chine a besoin de puissants processeurs. Cependant, les États-Unis ont émis des restrictions sur les importations chinoises des meilleurs GPU de NVIDIA tels que le H100, la GeForce RTX 4090 ou le prochain H200. La Chine a dû se résoudre à travailler sur des puces natives, occasionnant un retard technologique global pour ses ingénieurs. Ce retard est encore plus visible pour l’IA :

Les meilleurs acteurs de l’IA du pays ont déjà plusieurs années de retard sur leurs pairs américains en matière d’IA générative, un domaine dans lequel le modèle de gouvernance de l’Internet vanté par Pékin semble être un handicap (…)

Extrait du rapport du SCMP

Où en est la Chine concernant l’IA ?

L’avènement de Sora

L’arrivée de l’IA texte-vidéo Sora2 a aggravé la distance entre la Chine et les États-Unis. Elle est capable de générer des vidéos réalistes à partir d’une invite textuelle. Les utilisateurs peuvent modifier les vidéos produites. 

De plus, Sora3 prendra bientôt le son en charge pour des rendus plus réalistes. En début février dernier, OpenAI a publié une vidéo de 60 secondes4 générée par Sora, alors que ses concurrents, en phase pilote, produisent environ 4 secondes de vidéo. Cette performance inégalée a provoqué un électrochoc parmi les professionnels chinois. 

Sora constitue un challenge d’envergure pour la Chine. 

Les autres éléments à prendre en compte

La scission technologique interne de la Chine

Les réactions sont mitigées face à l’avancée des États-Unis concernant l’IA. D’une part, certaines entreprises souhaitent adopter les modèles les plus avancés. D’autre part, certains professionnels préfèrent œuvrer pour la suprématie technologique chinoise. Cette dernière option semble la meilleure, vu les restrictions américaines. 

Un mode de pensée disruptif

Les entreprises technologiques américaines sont en recherche constante de financement pour leurs recherches. En conséquence, elles exposent leurs avancées en temps réel, en profitant de l’effet publicitaire. 

Au contraire, les entreprises chinoises disposent déjà de fonds imposants pour financer leurs activités. Par exemple, le géant ByteDance recherche plutôt le meilleur moyen de transformer ses plateformes existantes. Par conséquent, les entreprises chinoises communiquent moins publiquement. 

Une créativité chinoise florissante

Plusieurs entreprises chinoises se sont engagées dans la conversion texte-vidéo. Nous citerons :

  • TenCent AI, avec sa boîte à outils open source VideoCrafter qui génère et édite les vidéos
  • ByteDance, avec son outil IA MagicVideo-V2

De plus, des chercheurs de l’Université de Pékin et la société d’IA Rabbitpre de Shenzhen se sont associés pour lancer l’initiative texte-vidéo Open-Sora, comportant 13 membres émérites, via le laboratoire “Rabbitpre AIGC Joint Lab”. Grâce aux contributions open source, l’initiative Open-Sora a produit 4 démonstrations de vidéos de résolutions et formats variés, allant de 3 à 24 secondes5.

Des perspectives encourageantes

Fédérer les forces

Des communautés IA d’échange d’idées se sont constituées en Chine. 

(…) Nous sommes un peu en retard sur l’aspect modèle, mais nous sommes très forts dans l’application de la technologie texte-vidéo et d’autres éléments tout aussi essentiels à la création vidéo IA, comme l’imagination et la narration.

Huang Chujie, professionnel de la publicité et passionné de vidéo générée par l’IA

Ces communautés, constituées de professionnels et de passionnés, sont actives et multiplient les initiatives pour rester visibles.

Conquérir les marchés extérieurs

La Chine poursuit sa conquête des marchés extérieurs en misant sur son originalité.

Les outils AIGC [AI Generated Content, ndlr] connaissent peu la Chine, en particulier son histoire.

Ni Kaomeng, auteur du lancement en juin 2023 de la China AIGC Industrial Alliance

Des dizaines d’entreprises chinoises proposent des alternatives fiables d’IA texte-vidéo, actuellement moins performantes que Sora, mais qui tiennent compte des spécificités locales.  

C’est la toute première étape vers l’exportation de la culture chinoise à l’ère de l’IA.

Ni Kaomeng
Quelques exemples d’IA texte-vidéo chinoises
  • PixVerse
  • CapCut
  • NeverEnds

Que peut faire la Chine pour rattraper son retard concernant l’IA ?

  • Produire des puces IA à haute performance
  • Former des grands modèles de langage (Large Language Models, LLM)6
  • Renforcer ses investissements en recherche et développement (R&D)

Il ne s’agit plus d’imiter ce qui fonctionne pour les autres, mais plutôt de concevoir un environnement adapté aux ambitions et aux contraintes locales chinoises.

Les questions fréquentes sur le sujet

Comment la Chine espère-t-elle rattraper son retard technologique concernant l’IA ? 

La Chine compte rattraper son retard concernant l’IA en intervenant principalement à 2 niveaux :

1. Développer une technologie locale pour rattraper son retard de production de processeurs, qui affecte la qualité de ses recherches IA
2. Miser sur son originalité culturelle pour vulgariser son image de marque à l’international 

Quels sont les atouts principaux de l’IA Sora ?

Avec Sora, les images générées et les transitions sont de meilleure qualité. De plus, Sora produit des vidéos de longue durée et vous permet d’éditer le premier rendu vidéo généré. 

Quelles sont les craintes vis-à-vis de l’IA texte-vidéo ?

L’IA Sora est plus gourmande en électricité que ses congénères pour fonctionner, ce qui réduit les marges bénéficiaires et aggrave les risques environnementaux. Une fois développée, l’IA texte-vidéo peut constituer une menace pour l’emploi des humains. Enfin, sans moyens de contrôle adaptés, il sera de plus en plus difficile de distinguer les vidéos générées par l’IA et celles créées avec les méthodes traditionnelles.

En attendant, pour prévenir les cas de Fake News en pleine année électorale, Sora ne sera probablement pas autorisée à générer des images de personnalités publiques.  

Quand est-ce que Sora sera disponible ?

Sora sera disponible d’ici quelques mois. En attendant, OpenAI recherche comment réduire sa consommation de ressources à l’utilisation. Selon les habitudes de OpenAI, le grand public devrait avoir le choix entre une version basique et un forfait payant.  

Les américains dominent l’IA

La course technologique entre la Chine et les États-Unis pour dominer l’IA avance par soubresauts. Avec Sora, OpenAI marque un point pour les américains.

  • Sora est plus performante que toutes les autres IA texte-vidéo actuelles
  • Cependant, elle ne sera disponible pour le grand public que d’ici quelques mois
  • Les IA chinoises ont besoin, entre autres, de puces plus puissantes pour se développer
  • La Chine souhaite rattraper son retard dans le domaine de l’IA en impliquant les acteurs locaux

“Tel est pris qui croyait prendre”, comme l’affirme La Fontaine. Pour retrouver son avantage technologique mondial, la Chine doit désormais presser le pas.  


Références :

  1. Travailler de 9h à 21h, 6 jours par semaine : le 996, rythme de travail éreintant en Chine, Ouest-France. Publié le 02 septembre 2021. Consulté le 11 mars 2024. ↩︎
  2. Creating video from text, OpenAI. Consulté le 11 mars 2024. ↩︎
  3. OpenAi’s Sora text-to-video generator will be publicly available later this year, The Verge. Publié le 13 mars 2024. Consulté le 13 mars 2024. ↩︎
  4. Insiders share China’s text-to-video development situation, market and industry prospect, Global Times. Publié le 14 mars 2024. Consulté le 14 mars 2024. ↩︎
  5. Chinese researchers aim to replicate OpenAi’s Sora text to video capabilities, Tom’s Hardware. Publié le 05 mars 2024. Consulté le 11 mars 2024. ↩︎
  6. With Sora, is China’s AI falling further behind? ThinkChina. Publié le 14 mars 2024. Consulté le 14 mars 2024. ↩︎
Partagez cet article
Laisser un commentaire