Cinematic video from references
Seedance 2.0 Fast Reference to Video és el model de generació de vídeo més avançat de ByteDance, dissenyat específicament per a creadors que necessiten vídeos de qualitat cinematogràfica amb àudio ric i sincronitzat, tot generat a partir d'una combinació flexible de prompts de text, imatges de referència, vídeos de referència i fins i tot entrades d'àudio. Sigui que sigueu un cineasta previsualitzant una escena, un dissenyador animant un concepte o un creador de continguts produint clips virals per a xarxes socials, aquest model us ofereix un control de nivell director sobre la vostra narració visual.
Al seu nucli, Seedance 2.0 Fast Reference to Video transforma la vostra visió creativa en una sortida de vídeo polida amb física del món real, moviment natural i generació d'àudio nativa. El que el diferencia és el seu sistema de referències multimodals: podeu proporcionar fins a nou imatges de referència, fins a tres vídeos de referència i fins a tres fitxers d'àudio, i després integrar-los directament en el vostre prompt de text per guiar la generació. Per exemple, podríeu carregar un retrat d'un personatge, una foto d'un entorn de fons i un clip de veu en off, i després escriure un prompt que indiqui al model exactament com combinar-los, referenciant cada entrada de manera natural dins de la vostra descripció. Això en fa una eina extraordinàriament potent per donar vida a storyboards, crear animacions estilitzades i produir vídeos de caps parlants amb sincronització labial.
La generació d'àudio nativa del model està activada per defecte i produeix efectes de so sincronitzats, paisatges sonors ambientals i parla sincronitzada labial que coincideixen amb l'acció visual a la pantalla. Això significa que els vostres vídeos generats arriben llestos per utilitzar — no cal buscar ni sincronitzar manualment l'àudio en postproducció. Si preferiu un vídeo silenciós o planeu afegir la vostra pròpia pista d'àudio, podeu simplement desactivar la generació d'àudio.
Seedance 2.0 ofereix una àmplia gamma de controls creatius versàtils que us permeten modelar la sortida exactament segons les vostres necessitats. Podeu triar entre set opcions de relació d'aspecte: 16:9 per a contingut estàndard en paisatge i gran pantalla, 9:16 per a vídeos verticals i en format retrat perfectes per a plataformes socials com TikTok o Instagram Reels, 1:1 per a formats quadrats, 4:3 i 3:4 per a composicions clàssiques i altes, 21:9 per a formats cinematogràfics ultraampls ideals per a seqüències d'estil cinematogràfic, o auto per deixar que el model decideixi intelligentment basant-se en el vostre prompt. La durada del vídeo és igualment flexible, des de 4 fins a 15 segons, amb una opció auto que permet al model determinar la longitud ideal segons la narrativa descrita en el vostre prompt. La resolució es pot establir en 720p per equilibrar qualitat i velocitat de generació, o 480p quan vulgueu resultats més ràpids — útil per a iteracions ràpides i previsualitzacions d'idees abans de fer un render final.
El flux de treball basat en referències és on aquest model brilla realment per als professionals creatius. Carregant imatges de referència (JPEG, PNG o WebP, fins a 30 MB cadascuna), podeu guiar l'estil visual del model, l'aparença dels personatges o la composició de l'escena. Els vídeos de referència (MP4 o MOV, amb una durada combinada entre 2 i 15 segons) us permeten proporcionar referències de moviment, indicacions de ritme o imatges existents per construir-hi a sobre. Els fitxers d'àudio de referència (MP3 o WAV, fins a 15 segons combinats) poden impulsar l'animació de sincronització labial o establir el to sonor d'una escena — tot i que les entrades d'àudio requereixen com a mínim una imatge o vídeo de referència al costat. Podeu combinar fins a 12 fitxers en total a través de tots els tipus d'entrada, donant-vos una gran llibertat creativa. Dins del vostre prompt, simplement referencieu aquestes entrades utilitzant etiquetes naturals com @Image1, @Video2 o @Audio1 per indicar al model com ha d'influir cada referència en la sortida final.
Aquest model és especialment adequat per a animació de personatges, previsualització d'efectes visuals, conceptes de videoclips musicals, demostracions de productes, contingut per a xarxes socials i curts narratius. Les seves fortaleses en contingut estilitzat, transformació i capacitats de sincronització labial en fan una opció destacada per a creadors que treballen en aquests gèneres. La simulació de física del món real significa que els objectes cauen, l'aigua flueix i els personatges es mouen amb un pes i impuls creïbles, aportant un poliment cinematogràfic que eleva el contingut generat més enllà del vídeo AI típic.
Per a la reproductibilitat, podeu establir un valor de seed per generar resultats similars en múltiples execucions, cosa útil quan itereu en un concepte i voleu sortides consistents. Tingueu en compte que, fins i tot amb el mateix seed, poden produir-se lleugeres variacions entre generacions.
Algunes consideracions pràctiques a tenir en compte: els vídeos de referència haurien d'estar entre aproximadament 480p i 720p de resolució per obtenir els millors resultats. Els fitxers d'imatge individuals poden arribar fins a 30 MB, mentre que la mida total de totes les referències de vídeo hauria de mantenir-se sota 50 MB, i cada fitxer d'àudio no hauria de superar els 15 MB. El nombre total de fitxers a través d'imatges, vídeos i àudio combinats no ha de superar els 12. Treballar dins d'aquestes directrius assegura que el model pugui processar les vostres referències de manera efectiva i lliurar la sortida de la màxima qualitat.
Seedance 2.0 Fast Reference to Video representa un salt significatiu en la generació de vídeo accessible i d'alta qualitat. Reuneix la flexibilitat d'entrada multimodal, qualitat visual cinematogràfica, àudio natiu amb sincronització labial i controls creatius intuïtius en una sola eina poderosa — dissenyada per a creadors que exigeixen resultats professionals sense la complexitat dels fluxos de treball de producció tradicionals.
A woman kneeling in darkness, illuminated by a warm, radiant beam of light emerging from her raised hand.
Descriu l'escena del vídeo amb moviment, angles de càmera i ambient
El model crea moviment cinematogràfic amb física i il·luminació naturals
Descarrega i comparteix el teu vídeo llest per producció
Demostra la simulació de física del món real del model i dinàmiques atmosfèriques — renderitzant sistemes meteorològics creïbles, moviment animal i transformacions ambientals dramàtiques amb llenguatge cinematogràfic de qualitat Netflix i àudio natiu.
Mostra la precisió de Seedance 2.0 amb física d'objectes, dinàmiques de líquids, detall macro i transicions estilitzades sense costures — ideal per a cinematografia de productes de luxe amb foley sincronitzat i àudio atmosfèric.
“Cinematic reveal of a sleek black luxury sports car in a dark studio. Camera starts close on the chrome badge, slowly pulling back while orbiting 180 degrees around the vehicle. Dramatic rim lighting gradually intensifies, highlighting the car's sculptural curves and glossy finish. Reflections dance across the body as the camera moves. Dust particles float in volumetric light beams. Final wide shot reveals the full silhouette against a gradient backdrop. 8 seconds, smooth motion, 24fps cinematic quality.”
Canvia a la síntesi guiada pel raonament avui

Stylish text-to-video generation
0.1 crèdits

Smooth, coherent AI video generation
2 crèdits
![Kling Video v3 Text to Video [Standard]](/marketing-assets/_next/image?url=https%3A%2F%2Fv3b.fal.media%2Ffiles%2Fb%2F0a8cfc9f%2Fdei5OqFRB9HK8AgSHwk8f_9a5eea197b3045d1be55aedb0213f6f9.jpg&w=3840&q=75)
Cinematic text-to-video with audio
4.2 crèdits

Fast, high-quality text-to-video
2.1 crèdits

Character-driven video from references
2 crèdits

Cinematic video with native audio
1.4 crèdits

Cinematic video from references
10 crèdits

High-quality, fast video generation
2 crèdits

Film-grade video with audio
0.1 crèdits