Génération de vidéos avec l’IA

Stability AI a conçu Stable Video Diffusion (SVD) pour servir une large gamme d'applications vidéo dans des domaines tels que les médias, le divertissement, l'éducation et le marketing.

Cette IA permet de transformer des textes et des images en scènes vivantes et de passer du concept à la créations cinématographiques en direct.

https://youtu.be/G7mihAy691g?si=57h-p9QdhauqddRx

<a
  target="_blank"
  rel="noopener"
  href="<https://www.stablevideo.com/>"
  class="w-full link !text-primary-500 !opacity-100 !border-primary-500 hover:!opacity-80 feather-button-link inline-flex items-center justify-center bg-primary-500 text-base font-semibold !text-primary-50 rounded-cta-button-radius px-2 py-2 hover:bg-primary-600 hover:text-secondary-100 focus:outline-none focus:outline-2 focus:outline-offset-2 focus:outline-primary-500 active:bg-primary-800 active:text-blue-100"
  style="font-size: 120%"
  data-umami-event="Clicked Link: <https://www.stablevideo.com/>"
  data-umami-href="<https://www.stablevideo.com/>"
>
  → Essayer Stable Vidéo
</a>

<div class="py-2 text-center"><a
  target="_blank"
  rel="noopener"
  href="<https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt-1-1/resolve/main/svd_xt_1_1.safetensors?download=true>"
  class="notion-link page-link"
  data-umami-event="Clicked Link: <https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt-1-1/resolve/main/svd_xt_1_1.safetensors?download=true>"
  data-umami-href="<https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt-1-1/resolve/main/svd_xt_1_1.safetensors?download=true>"
>
  → Télécharger SVD
</a></div>

<div class="py-2 text-center">
<a
	class="notion-link page-link"
	data-umami-event="Clicked Link: /svd#conception-du-modele-svd"
	data-umami-href="/svd#conception-du-modele-svd"
	href="/svd#conception-du-modele-svd"
>
	En savoir plus sur SVD
</a>
</div>

<aside> 📌 Stable Video Diffusion en bref

Stable Video Diffusion se présente sous la forme de deux modèles image-to-video, capables de générer 14 et 25 images et d’en faire une vidéo avec un frame rate de 3 à 30 images par seconde.

Il s'agit de modèles Open Source, dont le code et les poids sont librement accessibles.

→ Lire le document de recherche

Durée des vidéos

2 à 5 secondes

Images par seconde

Jusqu’à 30 FPS (images par seconde)

Temps de traitement

2 minutes ou moins

</aside>

La génération de vidéos par Stability AI

De l’image à la vidéo

SVD est un modèle image-to-video (img2vid). Vous fournissez la première image et le modèle génère un court clip vidéo à partir de celle-ci.

Exemples de vidéos générées avec SVD

Voici deux exemples d’images créées avec SDXL et les vidéos générées par Stable Video Diffusion à partir de ces images.

Untitled

000087.mp4

000080.mp4

Conception du modèle SVD

L'article intitulé Stable Video Diffusion: Scaling Latent Video Diffusion Models to Large Dataset (2023) d'Andreas Blattmann et de ses collaborateurs décrit en détail le modèle et son processus d'entraînement.

SVD se distingue par ses 1,5 milliard de paramètres, reflétant sa complexité et sa capacité à traiter des informations détaillées.

Pour son entraînement, il a bénéficié d'une base de données vidéo extrêmement vaste, assurant une diversité et une richesse de contenu. Dans la phase finale de son développement, le modèle a été affiné et perfectionné en utilisant un ensemble de données plus restreint, mais caractérisé par une qualité supérieure, afin d'optimiser sa précision et sa performance.

Etapes de formation de SVD

Le modèle SVD est passé par trois étapes de formation :

La création d'un modèle initial basé sur des images.