Reference-guided consistent video generation
Vidu est un modèle puissant de référence-à-vidéo qui transforme vos images fixes en vidéos dynamiques et animées guidées par des invites textuelles. Construit sur la dernière architecture de Vidu, ce modèle « Reference to Video Mix » est spécialement conçu pour maintenir la cohérence visuelle des sujets et des scènes dans le contenu vidéo généré — en faisant un outil exceptionnel pour les créateurs qui ont besoin que les personnages, objets ou environnements restent reconnaissables et conformes à leur marque tout au long de leur production vidéo.
Au cœur de Vidu, il combine deux entrées créatives : des images de référence et une invite textuelle. Vous fournissez jusqu'à quatre images de référence qui établissent l'identité visuelle de vos sujets ou scènes, puis décrivez en langage naturel ce que vous voulez voir se produire dans la vidéo. Le modèle mélange intelligemment ces entrées, générant une vidéo fluide qui préserve l'apparence et l'ambiance de vos références tout en donnant vie à votre vision écrite. Cela le rend fondamentalement différent des outils purement texte-à-vidéo — vous ne partez pas de zéro à chaque fois, mais vous bâtissez sur une base visuelle déjà établie.
L'une des fonctionnalités phares de Vidu est sa génération audio intégrée. Par défaut, le modèle produit des vidéos avec un son synchronisé, ce qui signifie que vos clips générés sont prêts avec un audio correspondant au contenu visuel. C'est un avantage créatif majeur pour les cinéastes, les créateurs de contenu pour réseaux sociaux et tous ceux qui produisent du contenu vidéo où la conception sonore est importante. Si vous préférez une vidéo silencieuse — par exemple pour un projet d'édition plus large où vous ajouterez votre propre bande-son —, vous pouvez simplement désactiver l'audio.
Le modèle offre une gamme polyvalente d'options de sortie pour s'adapter à presque n'importe quel contexte créatif. Vous pouvez choisir parmi cinq ratios d'aspect : grand écran (16:9) pour du contenu cinématographique et style YouTube, vertical (9:16) pour TikTok, Instagram Reels et les plateformes mobiles, classique (4:3) pour un style diffusé plus traditionnel, portrait (3:4) pour des compositions verticales stylisées, et carré (1:1) pour les publications sur réseaux sociaux et les mises en page équilibrées. Cette flexibilité permet un seul flux de travail pour produire du contenu optimisé pour plusieurs plateformes sans compromis.
Les options de résolution vont de 360p jusqu'à la pleine 1080p HD, vous donnant le contrôle sur l'équilibre entre la qualité de sortie et vos besoins spécifiques. Pour des aperçus rapides, des tests de concepts ou des explorations style storyboard, les résolutions plus basses permettent d'itérer rapidement. Quand vous êtes prêt pour une sortie de production finale, 1080p offre une vidéo nette en haute définition adaptée à un usage professionnel. La résolution par défaut de 720p représente un bon compromis pour la plupart des flux de travail créatifs.
La durée de la vidéo est entièrement ajustable de 1 à 16 secondes, avec un défaut de 5 secondes. Bien que cela semble court, ces clips sont des blocs de construction idéaux pour des projets plus grands — contenu court pour réseaux sociaux, vitrines de produits animées, séquences d'introduction de personnages, transitions de scènes et éléments d'effets visuels. Pour les créateurs travaillant en format court, 16 secondes suffisent souvent pour un clip complet et captivant.
Vos invites textuelles peuvent atteindre 2 000 caractères, vous laissant ample place pour описать des scènes complexes, des actions, des ambiances et des détails. Que vous écriviez quelque chose de concis comme « Un personnage marchant sur une plage attrapant une pomme » ou que vous élaboriez une description de scène riche en détails avec un éclairage spécifique, un mouvement de caméra et un ton émotionnel, le modèle s'adapte à une large gamme de complexité des invites.
Le système d'images de référence est là où Vidu brille vraiment pour les flux de travail créatifs professionnels. En acceptant 1 à 4 images de référence, le modèle permet une cohérence sophistiquée des sujets et des scènes. Imaginez que vous développez un personnage animé pour une campagne de marque — vous pouvez fournir plusieurs vues ou poses de ce personnage comme références, puis générer une vidéo de lui effectuant diverses actions décrites dans votre invite. Ce même principe s'applique à la visualisation de produits, où des images de référence d'un produit peuvent être animées en vidéos de vitrine dynamiques, ou à la conception d'environnements, où des paysages de référence peuvent prendre vie avec du mouvement et de l'atmosphère.
Pour les créateurs qui ont besoin de résultats reproductibles — essentiel lors de collaborations en équipe ou d'itérations sur une direction créative spécifique —, Vidu inclut une option de seed pour la cohérence. En utilisant la même valeur de seed avec des entrées identiques, vous pouvez régénérer la même sortie vidéo de manière cohérente. Cela est inestimable lors des processus de révision créative où vous devez reproduire un résultat spécifique, ou quand vous voulez apporter de petites modifications à votre invite tout en gardant les autres éléments créatifs constants.
Le modèle Reference to Video Mix de Vidu est idéalement adapté à une large gamme de professionnels créatifs. Les concepteurs de motion peuvent l'utiliser pour prototyper rapidement des séquences animées. Les gestionnaires de réseaux sociaux peuvent générer du contenu vidéo spécifique à la plateforme à partir d'images de marque. Les cinéastes et artistes de storyboard peuvent visualiser des scènes avant de s'engager dans une production complète. Les concepteurs de personnages peuvent voir leurs illustrations statiques prendre vie. Les photographes de produits peuvent transformer des prises de vue fixes en publicités vidéo engageantes. Et les artistes de concepts peuvent explorer comment leurs designs d'environnements se sentiraient en mouvement, avec un son ambiant.
Le modèle représente un équilibre judicieux entre contrôle créatif et facilité d'utilisation — vous fournissez les références visuelles et décrivez votre vision, et Vidu s'occupe du travail complexe de génération de vidéos cohérentes et visuellement consistantes avec audio optionnel, dans votre format et résolution choisis.
Add the image that you want change
Ajoutez une image optionnelle pour guider l’apparence, le personnage ou l’environnement
A woman kneeling in darkness, illuminated by a warm, radiant beam of light emerging from her raised hand.
Saisissez une invite - Le modèle comprend la physique, l’éclairage et l’intention émotionnelle de votre scène
Cliquez pour générer votre sortie finale et télécharger la vidéo de qualité production
Animez un paysage forestier luxuriant avec brouillard volumétrique, rayons de lumière dérivants et mouvement environnemental organique, pour des séquences nature cinématographiques idéales en contenu voyage, visuels ambiants et génériques.
Créez une animation produit premium avec liquide dynamique, réfractions lumineuses et mouvement de caméra élégant à partir d'une seule photo de produit, parfait pour l'e-commerce, publicité luxe et contenu social commerce.
Animez un paysage urbain nocturne avec néons clignotants, reflets luisants de pluie et vie environnementale, démontrant la capacité du modèle à gérer des scènes multi-éléments complexes avec éclairage dynamique pour films, clips musicaux et production créative.
“Animate with subtle natural movements. Add gentle breathing motion to shoulders. Create natural eye blinks every 2-3 seconds. Introduce slight head micro-movements. Hair moves softly as if in gentle breeze. Maintain the warm smile with subtle lip movements. Eyes should have natural catchlight movement. Keep animation subtle and lifelike, not exaggerated. 5 seconds, smooth looping.”
Passez à la synthèse guidée par le raisonnement dès aujourd'hui

Animate images into pro videos
1.6 crédits

Fast, high-quality image animation
2.1 crédits

Animate images into smooth video
2 crédits

Cinematic transitions between two images
0.1 crédits

Animate images into styled videos
0.1 crédits

Character-consistent video from references
0.1 crédits

Physics-driven video from images
0.4 crédits

Cinematic video from images
10 crédits

Cinematic video from images fast
0.1 crédits