Multi-shot cinematic text-to-video
Wan v2.6 Text to Video transforma descripciones escritas en clips de vídeo completamente realizados, ofreciendo a los profesionales creativos una forma rápida y flexible de dar vida a las ideas sin cámaras, escenarios ni equipos de producción. Construido como un modelo de texto a vídeo, lee tu prompt y genera secuencias de movimiento pulidas que pueden ir desde un plano continuo único hasta una narrativa multi-escena completa con cortes duros, movimientos de cámara y entornos cambiantes. Ya sea que estés creando un mini-tráiler cinematográfico, un clip para redes sociales o una pieza conceptual, este modelo convierte palabras en vídeo visualizable.
Una de las características destacadas de Wan v2.6 es su soporte para narrativas multi-toma. Al escribir tu prompt con segmentos temporizados —por ejemplo, describiendo lo que ocurre de 0 a 3 segundos, luego de 3 a 6 segundos, y así sucesivamente— puedes dirigir al modelo para que produzca un vídeo narrativo coherente que corta entre escenas distintas. La segmentación inteligente multi-toma del modelo mantiene el flujo de la historia a través de estos planos, haciendo posible crear algo que se sienta como una secuencia editada real: un macro primer plano, un plano general amplio, una cámara que avanza a través de una jungla o una órbita lenta alrededor de tu sujeto. También puedes desactivar el comportamiento multi-toma cuando solo quieras una toma única, limpia y continua.
El modelo escribe en inglés y chino, y los prompts pueden ser bastante detallados —hasta 1500 caracteres— por lo que tienes espacio para especificar estado de ánimo, iluminación, comportamiento de la cámara, grano de película, detalles del sujeto e incluso líneas habladas para los personajes. Para ayudar a que prompts más cortos o simples produzcan resultados más ricos, Wan v2.6 incluye una función opcional de expansión de prompt que reescribe y mejora inteligentemente tu descripción antes de generar. Esto es ideal para usuarios que quieren un resultado potente sin escribir instrucciones exhaustivamente detalladas, aunque añade un poco de tiempo de procesamiento. Cuando quieras control total sobre exactamente lo que se genera, puedes desactivarla y confiar en tus propias palabras.
Wan v2.6 genera vídeo en dos niveles de calidad —720p y 1080p— con 1080p como predeterminado para resultados nítidos y de alta resolución. (Nota que la salida en 480p no está disponible con este modelo.) Puedes elegir entre un conjunto versátil de relaciones de aspecto para adaptarte a tu plataforma de destino: 16:9 panorámico para trabajos cinematográficos y de paisaje, 9:16 vertical para móviles y feeds sociales, 1:1 cuadrado para publicaciones aptas para cuadrículas, y los clásicos 4:3 y 3:4 para un aspecto más tradicional o editorial. La duración del clip es igual de flexible, con opciones para vídeos de 5, 10 o 15 segundos, permitiéndote adaptar la salida desde un gancho rápido hasta un arco narrativo corto.
El audio es otra dimensión creativa que puedes añadir. Wan v2.6 te permite suministrar tu propia música de fondo o sonido para acompañar el vídeo generado. El audio que proporcionas se ajusta a la duración de tu clip: si tu pista es más larga que el vídeo, se recorta para ajustarse, y si es más corta, la parte restante del vídeo se reproduce en silencio. Los formatos compatibles incluyen WAV y MP3, con audio entre 3 y 30 segundos y archivos de hasta 15 MB. Esto facilita emparejar un visual generado con una pieza de música o cama sonora que ya hayas elegido.
Para afinar el aspecto y la sensación, el modelo ofrece algunos controles útiles. Un prompt negativo te permite describir lo que quieres evitar —cosas como baja resolución, errores visuales o artefactos no deseados— dirigiendo la generación lejos de problemas comunes de calidad. La opción de seed proporciona reproducibilidad: cuando reutilizas la misma seed junto con los mismos ajustes, puedes regenerar resultados consistentes o iterar intencionadamente en un aspecto que te guste. El modelo también devuelve el prompt real que usó cuando la expansión de prompt está activada, para que puedas ver exactamente cómo se interpretó y refinó tu descripción. Un verificador de seguridad integrado está activado por defecto para ayudar a mantener el contenido generado apropiado.
Los ejemplos documentados muestran maravillosamente el rango del modelo: escenas fotorrealistas al estilo 4K, iluminación cinematográfica, grano de película sutil, movimiento de cámara suave y salida limpia sin subtítulos, marcas de agua ni elementos de interfaz. Un solo prompt puede pasar de un pequeño zorro director chasqueando una claqueta, a una calle polvorienta del Oeste Salvaje al atardecer, a un río selvático brumoso, a una órbita lenta alrededor de la ventana de una estación espacial —todo dentro de una sola pieza cohesiva. Esto demuestra la fortaleza del modelo en entregar entornos variados, lenguaje de cámara dinámico y momentos impulsados por personajes dentro de un vídeo unificado.
Wan v2.6 es ideal para una amplia gama de profesionales creativos. Cineastas y artistas de storyboards pueden prototipar escenas y tráilers; creadores de redes sociales y marketeros pueden producir rápidamente clips verticales o cuadrados llamativos; diseñadores y artistas conceptuales pueden visualizar estados de ánimo, entornos y momentos de producto; y creadores de contenido de todo tipo pueden generar piezas de movimiento cortas y pulidas con una configuración mínima. Como habla inglés y chino y soporta múltiples encuadres y duraciones, se adapta a una amplia variedad de audiencias y plataformas.
Unas pocas consideraciones te ayudan a obtener los mejores resultados. Prompts detallados y bien estructurados —especialmente aquellos que especifican tomas, temporización, movimientos de cámara e iluminación— tienden a producir la salida más controlada y cinematográfica. Si prefieres escribir menos, apóyate en la expansión de prompt para desarrollar tu idea, teniendo en cuenta que añade un poco de tiempo de procesamiento. La segmentación multi-toma solo funciona cuando la expansión de prompt está activa, así que planifica en consecuencia al crear secuencias narrativas. Y recuerda que cualquier audio que añadas seguirá las reglas de temporización de recorte o silencio final para ajustarse a la duración de tu clip elegida. Con estas herramientas a mano, Wan v2.6 Text to Video ofrece una forma potente, expresiva y accesible de convertir la imaginación en movimiento.
A woman kneeling in darkness, illuminated by a warm, radiant beam of light emerging from her raised hand.
Describe la escena de tu vídeo con movimiento, ángulos de cámara y ambiente
El modelo crea movimiento cinematográfico con física e iluminación naturales
Descarga y comparte tu vídeo listo para producción
Resalta transiciones multi-escena fluidas, dinámicas naturales e iluminación ambiental: ideal para presentaciones cinematográficas o YouTube shorts. Captura cambios temporales fluidos y construcción de mundos dinámica.
Demuestra dinámicas de escena complejas, trabajo de cámara rápido y efectos de iluminación animados en formato narrativo cinematográfico. Perfecto para tráilers de YouTube o intros de presentaciones.
Muestra narración de procesos científicos, con movimientos de cámara y progresión temporal clara para explicar conceptos complejos. Adecuado para vídeos educativos panorámicos y presentaciones.
“Cinematic reveal of a sleek black luxury sports car in a dark studio. Camera starts close on the chrome badge, slowly pulling back while orbiting 180 degrees around the vehicle. Dramatic rim lighting gradually intensifies, highlighting the car's sculptural curves and glossy finish. Reflections dance across the body as the camera moves. Dust particles float in volumetric light beams. Final wide shot reveals the full silhouette against a gradient backdrop. 8 seconds, smooth motion, 24fps cinematic quality.”
Pásate hoy a la síntesis guiada por razonamiento

Cinematic video from references
0.4 créditos

Fast balanced text-to-video generation
1.6 créditos

Fast cinematic video with audio
0.1 créditos

Cinematic video with native audio
1.4 créditos

Cinematic video from references
10 créditos

Film-grade video with audio
0.1 créditos
Text to video with audio
0.7 créditos