Multi-shot cinematic text-to-video
Wan v2.6 Text to Video verwandelt geschriebene Beschreibungen in vollständig realisierte Videoclips und bietet kreativen Profis eine schnelle und flexible Möglichkeit, Ideen zum Leben zu erwecken – ohne Kameras, Kulissen oder Produktionsteams. Als Text-zu-Video-Modell entwickelt, liest es Ihren Prompt und erzeugt polierte Bewegungsaufnahmen, die von einem einzigen kontinuierlichen Take bis hin zu einer Multi-Szene-Narrative mit harten Schnitten, Kamerabewegungen und wechselnden Umgebungen reichen. Egal ob Sie einen kinematografischen Mini-Trailer, einen Social-Media-Clip oder ein Konzeptstück erstellen – dieses Modell macht aus Worten sehenswerte Videos.
Eines der herausragenden Merkmale von Wan v2.6 ist die Unterstützung für Multi-Shot-Storytelling. Indem Sie Ihren Prompt mit zeitlich abgegrenzten Segmenten schreiben – z. B. beschreiben, was von 0 bis 3 Sekunden passiert, dann von 3 bis 6 Sekunden usw. – können Sie das Modell anweisen, ein kohärentes Narrativ-Video zu erzeugen, das zwischen unterschiedlichen Szenen schneidet. Die intelligente Multi-Shot-Segmentierung des Modells hält die Geschichte über diese Takes hinweg flüssig, sodass Sie etwas schaffen können, das wie eine echte geschnittene Sequenz wirkt: ein Makro-Nahaufnahme, ein weiter Establishing Shot, eine vorwärtsdrängende Kamera durch einen Dschungel oder eine langsame Umlaufbahn um Ihr Motiv. Sie können das Multi-Shot-Verhalten auch deaktivieren, wenn Sie einfach einen einzelnen sauberen, kontinuierlichen Take wünschen.
Das Modell funktioniert in Englisch und Chinesisch, und Prompts können sehr detailliert sein – bis zu 1.500 Zeichen –, sodass Sie Stimmung, Beleuchtung, Kameraverhalten, Filmkorn, Motive-Details und sogar gesprochene Zeilen für Charaktere angeben können. Um kürzere oder einfachere Prompts zu reicheren Ergebnissen zu verhelfen, bietet Wan v2.6 eine optionale Prompt-Erweiterung, die Ihre Beschreibung intelligent umschreibt und verbessert, bevor sie generiert wird. Das ist ideal für Nutzer, die starke Ausgaben ohne ausführliche Anweisungen wollen, verlängert allerdings die Verarbeitungszeit etwas. Wenn Sie volle Kontrolle über das Generierte wünschen, können Sie diese Funktion ausschalten und auf Ihre eigenen Formulierungen setzen.
Wan v2.6 liefert Videos in zwei Qualitätsstufen – 720p und 1080p –, wobei 1080p standardmäßig für knackige, hochauflösende Ergebnisse verwendet wird. (Hinweis: Niedrigere 480p-Ausgabe ist mit diesem Modell nicht verfügbar.) Sie können aus einer vielseitigen Auswahl an Seitenverhältnissen wählen, um zu Ihrer Zielplattform zu passen: Breitbild 16:9 für kinematografische und Landschaftsarbeiten, vertikal 9:16 für Mobile und Social Feeds, quadratisch 1:1 für gridfreundliche Posts sowie die klassischen 4:3- und 3:4-Formate für einen traditionelleren oder redaktionellen Look. Die Clip-Länge ist ebenso flexibel, mit Optionen für 5-, 10- oder 15-Sekunden-Videos, sodass Sie die Ausgabe von einem schnellen Hook bis zu einem kurzen Narrativ-Bogen anpassen können.
Audio ist eine weitere kreative Dimension, die Sie hinzufügen können. Wan v2.6 ermöglicht es Ihnen, eigene Hintergrundmusik oder Sounds zur generierten Video hinzuzufügen. Das bereitgestellte Audio wird an die Länge Ihres Clips angepasst: Wenn der Track länger als das Video ist, wird er gekürzt; wenn kürzer, läuft der Rest des Videos stumm. Unterstützte Formate umfassen WAV und MP3, mit Audio zwischen 3 und 30 Sekunden und Dateien bis zu 15 MB. So können Sie ein generiertes visuelles Element einfach mit einer Musik oder einem Soundbett kombinieren, das Sie bereits ausgewählt haben.
Zur Feinabstimmung des Looks und Gefühls bietet das Modell einige hilfreiche Steuerelemente. Ein negativer Prompt lässt Sie beschreiben, was Sie vermeiden wollen – wie niedrige Auflösung, visuelle Fehler oder unerwünschte Artefakte –, und lenkt die Generierung von gängigen Qualitätsproblemen weg. Eine Seed-Option sorgt für Reproduzierbarkeit: Bei Wiederverwendung desselben Seeds mit denselben Einstellungen können Sie konsistente Ergebnisse neu generieren oder gezielt an einem Look iterieren. Das Modell gibt auch den tatsächlich verwendeten Prompt zurück, wenn die Prompt-Erweiterung aktiviert ist, sodass Sie genau sehen können, wie Ihre Beschreibung interpretiert und verfeinert wurde. Ein integrierter Sicherheitsprüfer ist standardmäßig aktiviert, um generierte Inhalte angemessen zu halten.
Die dokumentierten Beispiele zeigen die Bandbreite des Modells eindrucksvoll: fotorealistische 4K-ähnliche Szenen, kinematografische Beleuchtung, dezentes Filmkorn, flüssige Kamerabewegungen und saubere Ausgaben ohne Untertitel, Wasserzeichen oder Interface-Elemente. Ein einziger Prompt kann von einem winzigen Fuchs-Regisseur mit Klapperbrett zu einer staubigen Western-Straße bei Sonnenuntergang, einem nebligen Dschungel-Fluss bis hin zu einer langsamen Umlaufbahn um ein Raumstation-Fenster übergehen – alles in einem kohärenten Stück. Das demonstriert die Stärke des Modells bei abwechslungsreichen Umgebungen, dynamischer Kamerasprache und charaktergetriebenen Momenten in einem einheitlichen Video.
Wan v2.6 ist ideal für eine breite Palette kreativer Profis. Filmemacher und Storyboard-Künstler können Szenen und Trailer prototypen; Social-Media-Creator und Marketer schnell auffällige vertikale oder quadratische Clips produzieren; Designer und Konzeptkünstler Stimmungen, Settings und Produktmomente visualisieren; und Content-Creator aller Art kurze, polierte Bewegungsstücke mit minimalem Aufwand generieren. Da es Englisch und Chinesisch spricht und mehrere Formate und Dauer unterstützt, passt es sich einer Vielzahl von Zielgruppen und Plattformen an.
Einige Hinweise helfen Ihnen, die besten Ergebnisse zu erzielen. Detaillierte, gut strukturierte Prompts – insbesondere solche, die Takes, Timing, Kamerabewegungen und Beleuchtung spezifizieren – erzeugen die kontrolliertesten und kinematografischsten Ausgaben. Wenn Sie weniger schreiben möchten, nutzen Sie die Prompt-Erweiterung, um Ihre Idee auszubauen, beachten Sie aber die etwas längere Verarbeitungszeit. Multi-Shot-Segmentierung funktioniert nur bei aktivierter Prompt-Erweiterung, planen Sie das bei narrativen Sequenzen entsprechend. Und denken Sie daran, dass hinzugefügtes Audio den Regeln für Kürzen oder anhaltende Stille folgt, um zur gewählten Clip-Länge zu passen. Mit diesen Tools bietet Wan v2.6 Text to Video eine leistungsstarke, ausdrucksstarke und zugängliche Möglichkeit, Imagination in Bewegung umzusetzen.
A woman kneeling in darkness, illuminated by a warm, radiant beam of light emerging from her raised hand.
Beschreibe deine Videoszene mit Bewegung, Kamerawinkeln und Stimmung
Das Modell erzeugt filmische Bewegung mit natürlicher Physik und Beleuchtung
Lade dein produktionsfertiges Video herunter und teile es
Hebt nahtlose Multi-Szenen-Übergänge, Naturdynamik und Umgebungsbeleuchtung hervor – ideal für kinematografische Präsentationen oder YouTube Shorts. Erfasst fließende zeitliche Veränderungen und dynamisches Weltbau.
Demonstriert komplexe Szenendynamik, schnelle Kameraführung und animierte Beleuchtungseffekte in kinematografischem Story-Format. Perfekt für YouTube-Trailer oder Präsentations-Intros.
Zeigt Storytelling wissenschaftlicher Prozesse mit Kamerabewegungen und klarer zeitlicher Abfolge zur Erklärung komplexer Konzepte. Geeignet für Landschafts-Edu-Videos und Präsentationen.
“Cinematic reveal of a sleek black luxury sports car in a dark studio. Camera starts close on the chrome badge, slowly pulling back while orbiting 180 degrees around the vehicle. Dramatic rim lighting gradually intensifies, highlighting the car's sculptural curves and glossy finish. Reflections dance across the body as the camera moves. Dust particles float in volumetric light beams. Final wide shot reveals the full silhouette against a gradient backdrop. 8 seconds, smooth motion, 24fps cinematic quality.”
Wechsle noch heute zur reasoning-gesteuerten Synthese

Cinematic video with native audio
1.4 Credits
Text to video with audio
0.7 Credits

Cinematic video from references
0.4 Credits

Cinematic video from references
10 Credits

Fast cinematic video with audio
0.1 Credits

Film-grade video with audio
0.1 Credits

Fast balanced text-to-video generation
1.6 Credits