Découvrez Sora, le ChatGPT de la vidéo signé OpenAI

Marie Louisy

Sora d’OpenAI : Nouvelle IA Multimodale pour transformer textes en vidéos réalistes

Sora est la nouvelle IA multimodale de OpenAI, le créateur de ChatGPT. Grâce à l’apprentissage automatique, elle transforme vos textes en vidéos. Le nom Sora, tiré du Japonais, signifie ciel en référence à son potentiel illimité1.   

Sora : Comment ça marche ?

Ce que vous pouvez faire avec Sora

  • Créer des vidéos à partir d’invites textuelles descriptives ou d’images
  • Allonger les vidéos existantes vers l’avant ou l’arrière
  • Réaliser des prouesses techniques inégalées jusqu’à maintenant

A travers ses scènes complexes, détaillées et réalistes2, Sora3 se distingue par 3 innovations.

La cohérence temporelle

Sora traite plusieurs images de vidéos simultanément. Par conséquent, les objets restent cohérents même lorsqu’ils entrent et sortent de la scène. 

L’association des transformateurs et des modèles de diffusion

Les modèles de diffusion sont réputés pour les détails, tandis que les transformateurs sont excellents pour une des images de haut niveau. Grâce à cette architecture hybride, la vidéo n’a plus besoin de correction pixel par pixel. Techniquement, cela s’appelle la réduction de dimensionnalité

Le récapitulatif pour une vidéo de haute fidélité

La récapitulation est une forme d’ingénierie automatique. Elle existait déjà dans DALL-E 3. L’IA reformule votre invite en y associant les détails indispensables pour un rendu plus cohérent. 

Les cas pour lesquels vous pouvez utiliser Sora

  • Les réseaux sociaux : Sora génère des contenus complexes et réalistes.
  • Le marketing et les campagnes publicitaires : Sora est une alternative valable pour les prises de vues traditionnellement coûteuses.
  • Les prototypes et les simulations réalistes d’idées créatives : Sora génère des vidéos réalistes de vos futurs produits avant de fabriquer les premiers prototypes.
  • Les données synthétiques : Sora génère des données synthétiques comme une alternative de qualité aux données réelles si vous avez des contraintes de faisabilité ou de confidentialité. 

Quelles sont les limites et les risques de Sora ?

Les limites de Sora

Dès les premières générations de vidéos, l’on constate chez Sora une incompréhension des lois physiques du monde réel. De plus, sa fiabilité n’est pas encore testée à grande échelle. 

Les risques liés à l’utilisation de Sora

Biais, stéréotypes et préjugés

Déjà récemment, nous avons observé le cas malheureux de Gemini. Le moindre biais inséré dans les données de formation de Sora provoquerait une cascade d’événements préjudiciables et incontrôlables. 

Les contenus inappropriés

  • Les vidéos sexuellement explicites
  • La violence
  • La haine
  • Les vidéos sanglantes
  • Les représentations désobligeantes des communautés
  • La promotion des activités illicites

Fake News et désinformation

Les Fake News4 sont générées pour induire sciemment les usagers en erreur, tandis que la désinformation résulte d’une confusion accidentelle. En pleine année électorale, la vigilance autour des IA doit être renforcée.

L’IA remodèle les stratégies de campagne, l’engagement des électeurs et le tissu même de l’intégrité électorale.5

Eske Montoya Martinez van Egerschot, responsable de la gouvernance et de l’éthique de l’IA chez DigiDiplomacy

Quelles sont les IA concurrentes de Sora ?

Les IA concurrentes de Sora : Les gros poissons

  • Runway-Gen-2 : Très médiatisée, elle est disponible sur bureau et mobile
  • Lumiere : Conçue par Google, il s’agit d’une extension dans Python
  • Make-a-video : Également disponible comme extension PyTorch, Make-a-video est une création de Meta

Les IA concurrentes de Sora : Les challengers

  • Elai, pour l’e-learning et les formations en entreprise
  • Pictory, pour les éducateurs et le marketing de contenu
  • Synthesia, pour des vidéos personnalisables incluant des avatars 
  • Steve AI, pour transiter facilement entre le script, l’audio et la vidéo
  • Kapwing, pour les créateurs occasionnels et les médias sociaux 
  • HeyGen est multifonctions : de l’éducation à la sensibilisation commerciale en passant par le marketing de produits et de contenu

Comment le lancement de Sora va-t-il participer au développement de l’IA ?

A court terme

Les plus

  • La facilitation du prototypage
  • Des ressources d’apprentissage plus performantes
  • Une avalanche de vidéos sur les réseaux sociaux
  • Une meilleure visualisation prédictive des données

Les moins

  • Les violations des droits d’auteurs
  • La dépendance technologique
  • La diffusion de la désinformation et des Fake News
  • La tension réglementaire et éthique 

A long terme

Les bienfaits

  • La personnalisation de l’éducation
  • La génération de contenu avancée
  • Des animations ultra ciblées
  • Le montage de vidéos en temps réel

Le bémol

La frontière entre le réel et le virtuel s’estompe déjà. Après la réalité virtuelle (VR) et la réalité augmentée (AR), les internautes adopteront de nouvelles habitudes de navigation en ligne. 

Quoi qu’il en soit, “cette technologie continuera de s’améliorer à pas de géant.”6

Les questions fréquentes sur le sujet

Quelle est la durée maximale des vidéos générées par Sora ? 

60 secondes. Cependant, vous pouvez prolonger artificiellement cette durée en créant des séquences vidéo successives.  

Quand pourrons-nous accéder à Sora ?

Annoncé depuis le 15 février 2024, Sora est réservé actuellement à un échantillon limité de créateurs et d’informaticiens. Il n’y a aucune liste d’attente pour le grand public. Suite à l’intervention de ces experts, OpenAI aura de meilleures indications sur l’amélioration des services existants. 

Combien coûte Sora ?

OpenAI facture habituellement ses services premium. Par conséquent, il faut s’y attendre même si ce n’est pas à l’ordre du jour pour le moment.   

Sur le plan humain, que va-t-il se passer avec Sora ?

Avec l’émergence des dernières générations de l’IA, la frontière entre le virtuel et le réel s’estompera progressivement. C’est un tournant technologique à négocier progressivement avec éthique et bienveillance. 

OpenAI risque encore bien de nous surprendre   

Il y aura de plus en plus d’outils IA similaires à Sora. Les enjeux des modèles de conversion texte-vidéo sont multiples :

  • Sora est un modèle de génération et de diffusion texte-vidéo
  • Il est le plus avancé au moment de l’annonce de sa sortie
  • Avec Sora, de nombreux métiers connaîtront une accélération
  • Les aspects juridiques et éthiques du développement des IA de dernière génération sont à surveiller de près

Selon l’adage, “qui ne risque rien n’a rien.” OpenAI n’a pas encore divulgué l’origine des données de formation de Sora. Cependant, l’avenir sera un parterre de roses ou un champ d’épines selon l’utilisation qui sera faite des IA de dernière génération.  


Références :

  1. Sora (text-to-video model), Wikipedia. Consulté le 26 février 2024. ↩︎
  2. Sora, OpenAI’s new text-to-video tool is causing excitement and fears. Here’s what we know about it, Euronews. Publié le 18 février 2024. Consulté le 26 février 2024. ↩︎
  3. Creating video from text, OpenAI. Publié le 15 février 2024. Consulté le 26 février 2024. ↩︎
  4. Everything to Know About OpenAI’s New Text-to-Video generator, Sora. Scientific American. Publié le 04 mars 2024. Consulté le 04 mars 2024. ↩︎
  5. What is OpenAI’s Sora? How it works, Use Cases, Alternatives & More, Datacamp. Publié le 19 février 2024. Consulté le 26 février 2024. ↩︎
  6. What two years of AI development can tell us about Sora, Vox. Publié le 23 février 2024. Consulté le 26 février 2024. ↩︎
Partagez cet article
Laisser un commentaire