Sora, le ChatGPT de la vidéo

La nouvelle vient de faire le tour du monde : après ChatGPT, Open AI lance aujourd’hui Sora, son outil de conversion de texte en vidéo, permettant d’illustrer mieux encore ses différents contenus.

Sora peut générer des vidéos à partir d’un prompt détaillé, incluant des mouvements de caméra fluides et des personnages expressifs. Même si l’outil n’est pas encore accessible au grand public, les premières vidéos mise en ligne sont étonnantes :

Vidéo du Huffington Post

Capacités Techniques de Sora en Vidéo

Sora peut générer des vidéos d’une durée maximale de 60 secondes, aujourd’hui suffisant pour de nombreux contenus et pour démontrer la puissance de l’outil. Il est bien sûr possible d’enchaîner différentes séquences dans un logiciel de montage par la suite.

Les vidéos produites par Sora sont dotées d’une résolution allant jusqu’à 1080p, et ne sont là aussi qu’un présage de l’avenir : il n’y a aucune raison pour que Sora ne nous propose pas dans un futur proche le choix entre 4K, 8K, 12k et bien plus encore. Pour en voir de nombreux aperçus, c’est ici : https://openai.com/sora

Ce qui est remarquable également, c’est le cadrage, parfois digne d’un très bon réalisateur, ainsi que les détails et mouvements se déroulant autour de la sujet principal. Mouvements de caméra fluides, profondeur de champs, figurants présents dans la scène : tout y est ! Le résultat est souvent bluffant et l’expérience visuelle très immersive.

De plus, Sora peut créer des vidéos aussi bien d’apparence filmées que des vidéos en 3D : Pixar n’a qu’à bien se tenir !

Quelles sont les limites de Sora ?

Comme on l’a déjà remarqué en introduction, la durée maximale de 60 secondes peut être un handicap, d’autant que même si on s’amuse à découper une création en plusieurs séquences inférieures à 1 mn, l’IA peut donner des éléments ou des personnages totalement différents d’un prompt à l’autre, et donc d’un plan à l’autre. Les faux raccords quelquefois constatés au cinéma seraient alors trop nombreux. 

Bien sûr, il faudra se méfier de certaines incohérences ou contradictions dans certaines images. Sora crée mais sans connaissance du contexte, de certaines subtilités qu’aujourd’hui seul un humain peut distinguer. Et même si les mouvements de caméra paraissent fluides et travaillés, il n’est apparement pas encore possible de les diriger plus finement. Sora décide pour vous … enfin, pour l’instant !

Sora invente le chat à 5 pattes

Certaines complexités sont plus difficiles à résorber. Par exemple, dans certaines images créées par les petits frères de Sora, tels que Midjourney et Dall-E, apparaissent régulièrement des mains à 4 doigts. Et bien bis repetita, même dans une des vidéos officielles de démonstration de Sora, ce chat si réaliste déploie une 5ème patte !

Une petite place pour l’humain ?

Heureusement , et comme souvent à chaque avancée des outils d’Intelligence Artificielle, l’humain conserve toute sa place s’il sait tirer partie de ces nouvelles technologies : Sora ne peut pas remplacer la créativité humaine dans la conception de scénarios complexes ou la résolution de problèmes créatifs imprévus. Sora ne peut pas prendre des décisions contextuelles complexes ou interpréter les nuances subtiles d’une situation comme le ferait un être humain. Il faudra donc être vigilant pour ne pas risquer de créer une polémique en diffusant une vidéo ayant laissé un détail choquant pour la communauté.

Et bien que Sora puisse représenter des personnages expressifs, il ne possède pas une véritable intelligence émotionnelle et ne peut (encore ?) pas interagir avec les émotions humaines de la même manière qu’une personne réelle. Les acteurs et réalisateurs ont donc toujours leur raison d’être !

Comprendre ces limitations est essentiel pour utiliser Sora de manière efficace et maximiser ses capacités tout en reconnaissant ses limites.

Alors Sora, pour quoi faire ?

Pour l’instant, Sora n’est pas accessible à tout le monde, et seuls quelques utilisateurs bien choisis y auront accès… mais on a hâte de tester ce nouvel outil ! 

En effet, même si quelques petits défauts subsistent, ce type d’outil de création de séquences vidéo par IA peut être le compagnon idéal pour créer de nouveaux contenus qui attirent l’attention sur les réseaux sociaux, personnaliser des vidéos publicitaires en ligne, et donc en tester de multiples versions sans coût de réalisation supplémentaire ni de délais de production. On peut aussi penser que la vidéo deviendrait ainsi accessible aux PME qui n’avaient pas jusqu’à présent les budgets pour réaliser de telles séquences.

🔗 Découvrez Sora sur https://openai.com/sora

Allez, un dernier petit exemple de réalisation de Sora :

Prompt : vidéo en gros plan photoréaliste de deux navires pirates s’affrontant alors qu’ils naviguent dans une tasse de café.