Multi-shot cinematic text-to-video
Wan v2.6 Text to Video transforme les descriptions écrites en clips vidéo entièrement réalisés, offrant aux professionnels créatifs un moyen rapide et flexible de donner vie aux idées sans caméras, décors ou équipes de production. Construit comme un modèle texte-vidéo, il lit votre invite et génère des séquences en mouvement polies qui peuvent aller d'un seul plan continu à un récit multi-scènes complet avec coupes nettes, mouvements de caméra et environnements changeants. Que vous créiez une mini-bande-annonce cinématographique, un clip pour les réseaux sociaux ou une pièce conceptuelle, ce modèle transforme les mots en vidéo regardable.
Une des caractéristiques phares de Wan v2.6 est son soutien pour la narration multi-plans. En écrivant votre invite avec des segments temporels — par exemple, en décrivant ce qui se passe de 0 à 3 secondes, puis de 3 à 6 secondes, et ainsi de suite — vous pouvez diriger le modèle pour produire une vidéo narrative cohérente qui alterne entre des scènes distinctes. La segmentation multi-plans intelligente du modèle maintient l'histoire fluide à travers ces plans, rendant possible la création de quelque chose qui ressemble à une vraie séquence montée : un gros plan macro, un plan large d'établissement, une caméra qui avance à travers une jungle, ou une orbite lente autour de votre sujet. Vous pouvez aussi désactiver le comportement multi-plans quand vous voulez simplement un seul plan continu propre.
Le modèle fonctionne en anglais et en chinois, et les invites peuvent être assez détaillées — jusqu'à 1 500 caractères — vous avez donc de la place pour spécifier l'ambiance, l'éclairage, le comportement de la caméra, le grain de pellicule, les détails du sujet, et même les lignes parlées des personnages. Pour aider les invites plus courtes ou simples à produire des résultats plus riches, Wan v2.6 inclut une fonction d'expansion d'invite optionnelle qui réécrit intelligemment et améliore votre description avant la génération. C'est idéal pour les utilisateurs qui veulent un bon résultat sans écrire des instructions exhaustivement détaillées, bien qu'il ajoute un peu de temps de traitement. Quand vous voulez un contrôle total sur ce qui est généré, vous pouvez la désactiver et vous fier à vos propres mots.
Wan v2.6 génère des vidéos en deux niveaux de qualité — 720p et 1080p — avec 1080p comme valeur par défaut pour des résultats nets en haute résolution. (Notez que la sortie en 480p n'est pas disponible avec ce modèle.) Vous pouvez choisir parmi un ensemble polyvalent de ratios d'aspect pour correspondre à votre plateforme de destination : grand écran 16:9 pour les travaux cinématographiques et paysage, vertical 9:16 pour les flux mobiles et réseaux sociaux, carré 1:1 pour les publications adaptées aux grilles, et les cadrages classiques 4:3 et 3:4 pour un look plus traditionnel ou éditorial. La durée des clips est tout aussi flexible, avec des options pour des vidéos de 5, 10 ou 15 secondes, vous permettant d'adapter la sortie à tout, d'un accroche rapide à un arc narratif court.
L'audio est une autre dimension créative que vous pouvez ajouter. Wan v2.6 vous permet de fournir votre propre musique de fond ou son pour accompagner la vidéo générée. L'audio fourni est adapté à la durée de votre clip : si votre piste est plus longue que la vidéo, elle est coupée pour s'ajuster, et si elle est plus courte, la portion restante de la vidéo joue en silence. Les formats pris en charge incluent WAV et MP3, avec un audio entre 3 et 30 secondes et des fichiers jusqu'à 15 MB. Cela facilite l'association d'une visuelle générée à une pièce de musique ou un lit de son déjà choisi.
Pour affiner l'apparence et la sensation, le modèle offre quelques contrôles utiles. Une invite négative vous permet de décrire ce que vous voulez éviter — comme une faible résolution, des erreurs visuelles ou des artefacts indésirables — pour orienter la génération loin des problèmes de qualité courants. L'option de seed assure la reproductibilité : en réutilisant le même seed avec les mêmes paramètres, vous pouvez régénérer des résultats cohérents ou itérer intentionnellement sur un look qui vous plaît. Le modèle retourne aussi l'invite réelle utilisée quand l'expansion d'invite est activée, pour que vous puissiez voir exactement comment votre description a été interprétée et affinée. Un vérificateur de sécurité intégré est activé par défaut pour aider à maintenir le contenu généré approprié.
Les exemples documentés mettent magnifiquement en valeur la polyvalence du modèle : scènes photoréalistes style 4K, éclairage cinématographique, grain de pellicule subtil, mouvement de caméra fluide, et sortie propre sans sous-titres, filigranes ou éléments d'interface. Une seule invite peut passer d'un petit renard réalisateur claquant une claquettes, à une rue poussiéreuse de l'Ouest sauvage au coucher du soleil, à une rivière de jungle brumeuse, à une orbite lente autour d'une fenêtre de station spatiale — tout dans une seule pièce cohérente. Cela démontre la force du modèle pour livrer des environnements variés, un langage de caméra dynamique et des moments axés sur les personnages dans une vidéo unifiée.
Wan v2.6 est idéal pour une large gamme de professionnels créatifs. Les cinéastes et artistes de storyboard peuvent prototyper des scènes et des bandes-annonces ; les créateurs de réseaux sociaux et marketeurs peuvent rapidement produire des clips verticaux ou carrés accrocheurs ; les designers et artistes conceptuels peuvent visualiser des ambiances, décors et moments produits ; et les créateurs de contenu de tous genres peuvent générer des pièces en mouvement courtes et polies avec un minimum de configuration. Comme il fonctionne en anglais et en chinois et prend en charge plusieurs cadrages et durées, il s'adapte à une grande variété de publics et de plateformes.
Quelques considérations vous aident à obtenir les meilleurs résultats. Des invites détaillées et bien structurées — surtout celles qui spécifient les plans, le timing, les mouvements de caméra et l'éclairage — produisent généralement la sortie la plus contrôlée et cinématographique. Si vous préférez écrire moins, appuyez-vous sur l'expansion d'invite pour développer votre idée, en gardant à l'esprit qu'elle ajoute un peu de temps de traitement. La segmentation multi-plans ne fonctionne que quand l'expansion d'invite est active, alors planifiez en conséquence pour les séquences narratives. Et rappelez-vous que tout audio ajouté suivra les règles de timing de coupure ou de silence final pour correspondre à la durée de clip choisie. Avec ces outils en main, Wan v2.6 Text to Video offre un moyen puissant, expressif et accessible de transformer l'imagination en mouvement.
A woman kneeling in darkness, illuminated by a warm, radiant beam of light emerging from her raised hand.
Décrivez votre scène vidéo avec le mouvement, les angles de caméra et l'ambiance
Le modèle crée un mouvement cinématographique avec une physique et un éclairage naturels
Téléchargez et partagez votre vidéo prête pour la production
Met en lumière les transitions multi-scènes fluides, la dynamique naturelle et l'éclairage environnemental — idéal pour des présentations cinématographiques ou YouTube Shorts. Capture le changement temporel fluide et la construction dynamique de monde.
Démontre des dynamiques de scènes complexes, un travail de caméra rapide et des effets d'éclairage animés dans un format d'histoire cinématographique. Parfait pour les bandes-annonces YouTube ou intros de présentations.
Met en valeur le récit de processus scientifiques, avec mouvements de caméra et progression temporelle claire pour expliquer des concepts complexes. Adapté aux vidéos éducatives paysage et présentations.
“Cinematic reveal of a sleek black luxury sports car in a dark studio. Camera starts close on the chrome badge, slowly pulling back while orbiting 180 degrees around the vehicle. Dramatic rim lighting gradually intensifies, highlighting the car's sculptural curves and glossy finish. Reflections dance across the body as the camera moves. Dust particles float in volumetric light beams. Final wide shot reveals the full silhouette against a gradient backdrop. 8 seconds, smooth motion, 24fps cinematic quality.”
Passez dès aujourd'hui à la synthèse guidée par le raisonnement

Film-grade video with audio
0.1 crédits
Text to video with audio
0.7 crédits

Cinematic video with native audio
1.4 crédits

Fast cinematic video with audio
0.1 crédits

Fast balanced text-to-video generation
1.6 crédits

Cinematic video from references
0.4 crédits

Cinematic video from references
10 crédits