Smooth, coherent AI video generation
Wan Text to Video és el model de vídeo IA de última generació (versió 2.7) que transforma les teves descripcions escrites en clips de vídeo completament realitzats. Sigui que siguis un cineasta que vulgui previsualitzar una escena, un creador de contingut per xarxes socials que elabori material atractiu per als ulls, o un dissenyador que explori conceptes de moviment, aquest model converteix les teves idees en vídeo dinàmic d'alta qualitat amb una suavitat de moviment millorada, una fidelitat de escena superior i una major coherència visual.
Al seu nucli, Wan Text to Video funciona llegint el teu prompt de text —una descripció de l'escena, l'ànim, l'acció i l'estil visual que vols— i generant un vídeo que dona vida a aquestes paraules. Només has de descriure el que imagines, i el model s'encarrega del treball complex de crear moviment fluid, il·luminació realista, entorns coherents i subjectes consistents en cada fotograma.
Opcions de Resolució i Format
Wan Text to Video admet resolucions de sortida de fins a 1080p, oferint resultats nítids i d'alta definició adequats per a ús professional. També pots triar 720p si prefereixes resultats més ràpids o arxius més petits. El model ofereix un conjunt versàtil de relacions d'aspecte per adaptar-se a qualsevol plataforma o necessitat creativa: pantalla ampla estàndard (16:9) per a contingut cinematogràfic i d'estil YouTube, vertical (9:16) per a plataformes mòbils com Instagram Reels i TikTok, quadrat (1:1) per a feeds de xarxes socials, i formats clàssics (4:3 i 3:4) per a composicions més tradicionals o orientades a retrat. Aquesta flexibilitat et permet crear contingut adaptat exactament al teu format de lliurament sense necessitat de retallar o reencadrar després.
Durada Flexible del Vídeo
Tens un control precís sobre la longitud dels teus vídeos generats, que van des de 2 segons fins a 15 segons, ajustables en increments d'un segon. Aquest rang és ideal per crear des de bucles animats ràpids i clips per xarxes socials fins a previsualitzacions d'escenes més llargues i peces de conceptes de moviment. La durada predeterminada és de 5 segons, que ofereix un bon equilibri per a la majoria d'exploracions creatives.
Integració d'Àudio
Una de les característiques destacades de Wan Text to Video és la seva capacitat d'àudio. Pots proporcionar el teu propi fitxer d'àudio (en format WAV o MP3, entre 3 i 30 segons de durada, fins a 15 MB) per impulsar la generació del vídeo. Això obre possibilitats potents per a contingut de sincronització labial, visuals guiats per música i escenes reactives a l'àudio. Si no proporcions àudio, el model pot generar automàticament música de fons coincident per al teu vídeo, afegint una capa extra de poliment al teu resultat sense esforç addicional.
** Millora Intel·ligent del Prompt**
El model inclou una funció integrada de reescritura intel·ligent del prompt, activada per defecte, que agafa la teva descripció inicial i l'expandeix per produir resultats més rics i detallats. Això és especialment útil si escrius prompts més curts o informals —el model omple intel·ligentment detalls cinematogràfics, indicis visuals i elements estilístics que ajuden a produir un vídeo final d'alta qualitat. Pots veure exactament com és el prompt millorat després de la generació, donant-te una idea de com el model ha interpretat la teva visió. Si prefereixes mantenir el control total sobre les teves paraules exactes, pots desactivar aquesta funció.
Prompts Negatius per a Precisió
Per refinar encara més els teus resultats, Wan Text to Video admet prompts negatius —una manera d'especificar què no vols veure al teu vídeo. Per exemple, pots dir al model que eviti "low resolution, errors, worst quality, low quality" o qualsevol altre artefacte visual i estils que vulguis evitar. Això et dóna una capa extra de control creatiu, ajudant-te a guiar la sortida lluny d'elements no desitjats i cap a l'estètica que tens al cap.
Resultats Reprodubibles
Per als creadors que necessiten consistència —sigui que estiguis iterant en un concepte, creant una sèrie de clips relacionats o col·laborant amb altres—, el model admet un valor de llavor (seed) per a la reproductibilitat. Utilitzant la mateixa llavor juntament amb el mateix prompt i configuracions, pots regenerar resultats idèntics, fent fàcil afinar el teu enfocament o recrear un aspecte específic.
Contingut Estilitzat i Transformador
Wan Text to Video està especialment ben adaptat per a la creació de contingut estilitzat i transformació visual. Sigui que vulguis cinematografia fotorrealista, estètiques animades, entorns fantàstics o narració visual abstracta, el model està dissenyat per gestionar una àmplia gamma d'estils visuals amb coherència i artístria. Les seves capacitats de sincronització labial també el converteixen en una eina convincent per a contingut centrat en personatges on l'àudio i l'expressió visual han d'estar alineats.
Per a Qui És Aquest Model?
Aquest model és ideal per a una àmplia gamma de professionals i entusiastes creatius. Els cineastes i editors de vídeo poden utilitzar-lo per a prototipatge ràpid i previsualització. Els creadors de contingut per xarxes socials poden generar material que aturi el desplaçament en qualsevol format de plataforma. Els dissenyadors de moviment poden explorar conceptes animats sense tocar programari d'animació tradicional. Els músics i artistes d'àudio poden crear visuals que responguin i complementin el seu so. I qualsevol persona amb una visió creativa pot experimentar portant les seves idees a la vida en moviment —no cal experiència en producció de vídeo.
Seguretat del Contingut
Wan Text to Video inclou un sistema de moderació de contingut integrat que està activat per defecte, ajudant a garantir que tant les entrades com les sortides siguin adequades. Això proporciona tranquil·litat a l'hora de generar contingut, especialment per a projectes professionals o de cara al públic.
Amb la seva combinació de sortida d'alta definició, formatació flexible, generació guiada per àudio, millora intel·ligent del prompt i qualitat de moviment suau, Wan Text to Video representa una eina creativa poderosa per transformar idees escrites en contingut de vídeo dinàmic i polit.
A woman kneeling in darkness, illuminated by a warm, radiant beam of light emerging from her raised hand.
Descriu l'escena del vídeo amb moviment, angles de càmera i ambient
El model crea moviment cinematogràfic amb física i il·luminació naturals
Descarrega i comparteix el teu vídeo llest per producció
Aprovecha la fidelitat de escena superior del model per renderitzar dinàmiques atmosfèriques complexes —núvols de tempesta rodants, impacte de pluja a l'aigua i canvis dramàtics d'il·luminació— mostrant moviment ambiental a gran escala i transicions meteorològiques.
Prova les capacitats de pla seguidor del model i renderització de moviment amb un vehicle de moviment ràpid, distorsió de calor del desert i treball de lent dramàtic —combinant velocitat, paisatge i narració cinematogràfica en una seqüència contínua.
Empeny la suavitat de moviment de Wan 2.7 als seus límits amb física subaquàtica —teixit fluid, suspensió de cabells, caustics de llum i moviment lent i graciós— demostrant la capacitat del model per renderitzar entorns no estàndard amb precisió física.
“Cinematic reveal of a sleek black luxury sports car in a dark studio. Camera starts close on the chrome badge, slowly pulling back while orbiting 180 degrees around the vehicle. Dramatic rim lighting gradually intensifies, highlighting the car's sculptural curves and glossy finish. Reflections dance across the body as the camera moves. Dust particles float in volumetric light beams. Final wide shot reveals the full silhouette against a gradient backdrop. 8 seconds, smooth motion, 24fps cinematic quality.”
Canvia a la síntesi guiada pel raonament avui

Fast balanced text-to-video generation
1.6 crèdits

Character-driven video from references
2 crèdits

Fast, high-quality text-to-video
2.1 crèdits

High-quality, fast video generation
2 crèdits

Film-grade video with audio
0.1 crèdits

Cinematic video from references
10 crèdits

Fast cinematic video with audio
0.1 crèdits
![Kling Video v3 Text to Video [Standard]](/marketing-assets/_next/image?url=https%3A%2F%2Fv3b.fal.media%2Ffiles%2Fb%2F0a8cfc9f%2Fdei5OqFRB9HK8AgSHwk8f_9a5eea197b3045d1be55aedb0213f6f9.jpg&w=3840&q=75)
Cinematic text-to-video with audio
4.2 crèdits

Cinematic video with native audio
1.4 crèdits