Character-driven video from references
Wan 2.7 Reference to Video és un model de vídeo IA de última generació que transforma les teves imatges de referència, vídeos i prompts de text en contingut de vídeo coherent i impressionant. Dissenyat per a creadors que necessiten donar vida a personatges i escenes amb consistència i qualitat cinematogràfica, aquest model destaca generant vídeos que preserven fidelment l'aparença dels subjectes que proporciones, ja sigui un personatge específic, un objecte o fins i tot un estil estilitzat extret de les teves pròpies referències visuals.
Al seu nucli, aquest model resol un dels problemes més desafiants en la generació de vídeo IA: mantenir la identitat visual a través de fotogrames i plans. En pujar imatges o vídeos de referència dels teus personatges i objectes, dones al model un ancoratge visual clar. Combina-ho amb un prompt de text descriptiu i Wan 2.7 produeix vídeos amb una suavitat de moviment millorada, una fidelitat de l'escena superior i una coherència visual més gran que les generacions anteriors. El resultat és contingut de vídeo que sembla intencional i polit —no aleatori ni inconsistent.
Per a qui és aquest model?
Wan 2.7 Reference to Video està dissenyat per a una àmplia gamma de professionals creatius. Cineastes i productors de vídeo poden utilitzar-lo per prototipar ràpidament escenes, previsualitzar guions gràfics o generar material suplementari amb personatges consistents. Animadors i dissenyadors de moviment poden aprofitar imatges de referència per mantenir l'aparença d'un personatge a través de múltiples clips generats. Creadors de contingut per a xarxes socials, vídeos musicals o contingut de marca poden produir vídeos estilitzats i atractius a partir d'uns pocs materials de referència i una descripció escrita. Artistes conceptuals i dissenyadors poden explorar com les seves obres estàtiques es podrien traduir en moviment, provant idees cinematogràfiques abans de comprometre's amb un flux de producció complet.
Què pots crear
El model genera vídeo fins a una resolució de 1080p, oferint una sortida nítida i d'alta definició adequada per a ús professional. També pots triar 720p si prefereixes iteracions més ràpides o arxius més petits. Els vídeos poden durar de 2 a 10 segons, fent fàcil generar des d'un fragment de moviment ràpid fins a una escena més desenvolupada.
Una de les característiques destacades és el suport per a múltiples relacions d'aspecte. Pots generar vídeos panoràmics 16:9 ideals per a contingut cinematogràfic i d'estil YouTube, vídeos verticals 9:16 perfectes per a plataformes socials com TikTok i Instagram Reels, formats quadrats 1:1 per a publicacions a xarxes socials, o relacions 4:3 i 3:4 per a composicions més tradicionals o orientades a retrat. Aquesta flexibilitat et permet adaptar la sortida a qualsevol plataforma o context creatiu sense retallar ni reformatejar.
Generació basada en referències
El que diferencia aquest model és el seu enfocament basat en referències. Pots pujar una o més imatges de referència per definir l'aparença de personatges o objectes al teu vídeo. Necessites dos personatges diferents interactuant en una escena? Proporciona imatges de referència separades per a cadascun i el model gestiona la generació multi-subjecte. També pots proporcionar vídeos de referència, que informen tant l'aparença com l'estil de moviment dels teus subjectes. Això és increïblement potent per mantenir la continuïtat: imagina generar múltiples clips del mateix personatge en diferents entorns, tots amb l'aparença consistent.
El model també admet etiquetes per a transformacions estilitzades i capacitats de sincronització labial, obrint possibilitats creatives per a l'animació de personatges i escenes amb diàleg.
Controls creatius
La teva eina creativa principal és el prompt de text, que pot tenir fins a 5.000 caràcters —donant-te molt d'espai per descriure escenes complexes, ambients, moviments de càmera i detalls narratius. També pots utilitzar un prompt negatiu (fins a 500 caràcters) per dirigir el model lluny de qualitats indesitjables, com baixa resolució, artefactes visuals o estils específics que vulguis evitar.
Una característica especialment emocionant és el mode multi-plan. Quan s'activa, el model segmenta intel·ligentment el teu vídeo en múltiples plans en lloc de produir un pla continu únic. Això és ideal per crear seqüències narratives o edicions dinàmiques que semblen rodes professionals. Quan està desactivat, obtens un pla únic suau i ininterromput —perfecte per a plans establerts, revelacions de personatges o peces de moviment fluid.
Per a projectes que requereixen reproductibilitat, un valor de llavor et permet fixar resultats específics. Si generes un vídeo que t'encanta i vols recrear-lo exactament —o fer petits ajustos al prompt mantenint la mateixa base visual— utilitzar la mateixa llavor assegura una sortida consistent. Això és inestimable per a fluxos de treball creatius iteratius on refines un concepte pas a pas.
Qualitat i coherència
Wan 2.7 representa un salt generacional en la qualitat de vídeo IA. La documentació destaca tres fortaleses principals: suavitat de moviment millorada, que significa que els personatges i objectes es mouen de manera natural sense vibracions o transicions antinaturals; fidelitat de l'escena superior, assegurant que els entorns i escenaris que descrius es renderitzen amb precisió i detall; i major coherència visual, perquè els elements del teu vídeo mantenen l'aparença i relacions espacials de fotograma a fotograma.
Seguretat del contingut
El model inclou un sistema de moderació de contingut integrat que està activat per defecte, filtrant tant les teves entrades com la sortida generada. Això ajuda a assegurar que el contingut que crees es mantingui dins de límits adequats.
Consideracions pràctiques
Quan treballis amb imatges de referència, cada fitxer pot tenir fins a 20 MB, mentre que els vídeos de referència poden tenir fins a 100 MB cadascun. Aquests límits generosos signifiquen que pots proporcionar material font d'alta qualitat sense compressió pesada. Tingues en compte que el model funciona millor quan el teu prompt de text descriu clarament l'escena que vols, i els teus materials de referència proporcionen representacions netes i ben il·luminades dels subjectes que vols destacar.
Ja sigui que estiguis construint una narrativa basada en personatges, generant contingut social estilitzat, prototipant seqüències cinematogràfiques o explorant conceptes de disseny de moviment, Wan 2.7 Reference to Video et proporciona una eina potent i flexible per convertir la teva visió creativa en imatges en moviment amb una consistència i qualitat remarquables.
A woman kneeling in darkness, illuminated by a warm, radiant beam of light emerging from her raised hand.
Descriu l'escena del vídeo amb moviment, angles de càmera i ambient
El model crea moviment cinematogràfic amb física i il·luminació naturals
Descarrega i comparteix el teu vídeo llest per producció
Canvia a la síntesi guiada pel raonament avui

Stylish text-to-video generation
0.1 crèdits

Cinematic video from references
10 crèdits
![Kling Video v3 Text to Video [Standard]](/marketing-assets/_next/image?url=https%3A%2F%2Fv3b.fal.media%2Ffiles%2Fb%2F0a8cfc9f%2Fdei5OqFRB9HK8AgSHwk8f_9a5eea197b3045d1be55aedb0213f6f9.jpg&w=3840&q=75)
Cinematic text-to-video with audio
4.2 crèdits

Smooth, coherent AI video generation
2 crèdits

Cinematic video from references
0.4 crèdits

Fast, high-quality text-to-video
2.1 crèdits

Film-grade video with audio
0.1 crèdits

High-quality, fast video generation
2 crèdits

Cinematic video with native audio
1.4 crèdits