Cinematic video from references
Seedance 2.0 Fast Reference to Video er ByteDance's mest avancerede videogenereringsmodel, specielt udviklet til skabere, der har brug for biografkvalitetsvideo med rig, synkroniseret lyd — alt genereret fra en fleksibel kombination af tekstprompts, referencebilleder, referencevideoer og endda lydinputs. Uanset om du er en filminstruktør, der forhåndsviser en scene, en designer, der animerer et koncept, eller en content creator, der producerer scroll-stoppende sociale medieklip, giver denne model instruktørniveau-kontrol over din visuelle fortælling.
Kernen i Seedance 2.0 Fast Reference to Video omdanner din kreative vision til poleret videooutput med realistisk fysik, naturlig bevægelse og indbygget lydgenerering. Det, der adskiller den, er det multimodale referencesystem: du kan indlæse op til ni referencebilleder, op til tre referencevideoer og op til tre lydfiler og væve dem direkte ind i din tekstprompt for at styre genereringen. For eksempel kan du uploade et karakterportræt, et baggrundsmiljøfoto og en voiceover-klip og derefter skrive en prompt, der fortæller modellen præcis, hvordan de skal kombineres — med naturlig reference til hvert input i din beskrivelse. Dette gør det til et ekstremt kraftfuldt værktøj til at bringe storyboards til live, skabe stiliseret animation og producere læbesynkroniserede talking head-videoer.
Modelens indbyggede lydgenerering er aktiveret som standard og producerer synkroniserede lydeffekter, omgivende lydlandskaber og læbesynkroniseret tale, der matcher den visuelle handling på skærmen. Det betyder, at dine genererede videoer er klar til brug — ingen behov for at finde eller manuelt synkronisere lyd i efterbehandling. Hvis du foretrækker en stum video eller planlægger at tilføje din egen lydspor, kan du bare slå lydgenereringen fra.
Seedance 2.0 tilbyder et alsidigt udvalg af kreative kontroller, der lader dig forme outputtet præcis efter dine behov. Du kan vælge mellem syv aspektforholdsoptioner: 16:9 til standard landskabs- og bredskærmsindhold, 9:16 til vertikale og portræt-orienterede videoer, der er perfekte til sociale platforme som TikTok eller Instagram Reels, 1:1 til kvadratiske formater, 4:3 og 3:4 til klassiske og høje kompositioner, 21:9 til ultrabrede biografiske formater, der er ideelle til film-stil sekvenser, eller auto, så modellen intelligent vælger baseret på din prompt. Videolængden er ligeledes fleksibel og spænder fra 4 til 15 sekunder med en auto-option, der lader modellen bestemme den ideelle længde baseret på narrativet i din prompt. Opløsningen kan indstilles til 720p for en balance mellem kvalitet og genereringshastighed eller 480p, når du vil have hurtigere resultater — nyttigt til hurtig iteration og forhåndsvisning af idéer, før du forpligter dig til en endelig rendering.
Det referencebaserede workflow er stedet, hvor denne model virkelig skinner for kreative professionelle. Ved at uploade referencebilleder (JPEG, PNG eller WebP, op til 30 MB pr. stk.) kan du styre modelens visuelle stil, karakterudseende eller scene-komposition. Referencevideoer (MP4 eller MOV med en samlet varighed på 2-15 sekunder) lader dig give bevægelsesreferencer, tempokøer eller eksisterende optagelser at bygge videre på. Reference-lydfiler (MP3 eller WAV, op til 15 sekunder samlet) kan drive læbesynk-animation eller sætte den soniske tone for en scene — selvom lydinputs kræver mindst ét referencebillede eller -video sammen med dem. Du kan kombinere op til 12 filer i alt på tværs af alle inputtyper, hvilket giver dig enorm kreativ frihed. I din prompt refererer du blot til disse inputs ved hjælp af naturlige tags som @Image1, @Video2 eller @Audio1 for at fortælle modellen, hvordan hver reference skal påvirke det endelige output.
Denne model er særligt velegnet til karakteranimation, visuelle effekter-previsualisering, musikvideo-koncepter, produktpræsentationer, sociale medie-indhold og narrative kortfilm. Dens styrker inden for stiliseret indhold, transformation og læbesynk-funktionalitet gør den til et fremragende valg for skabere, der arbejder på tværs af disse genrer. Den realistiske fysiksimulation betyder, at objekter falder, vand flyder, og karakterer bevæger sig med overbevisende vægt og momentum, hvilket giver en biografisk polering, der løfter genereret indhold ud over typisk AI-video.
For reproducerbarhed kan du indstille en seed-værdi for at generere lignende resultater på tværs af flere kørsler, hvilket er nyttigt, når du itererer på et koncept og ønsker konsistente outputs. Bemærk, at selv med samme seed kan der opstå lette variationer mellem generationer.
Nogle praktiske overvejelser at have i mente: referencevideoer bør være mellem ca. 480p og 720p opløsning for bedste resultater. Enkelte billede-filer kan være op til 30 MB, mens den samlede størrelse af alle video-referencer bør holde sig under 50 MB, og hver lydfil bør ikke være større end 15 MB. Det samlede antal filer på tværs af billeder, videoer og lyd må ikke overskride 12. Arbejde inden for disse retningslinjer sikrer, at modellen kan behandle dine referencer effektivt og levere den højeste kvalitet i outputtet.
Seedance 2.0 Fast Reference to Video repræsenterer et stort sprang i tilgængelig, højkvalitets videogenerering. Den samler multimodal input-fleksibilitet, biografisk visuel kvalitet, indbygget lyd med læbesynk og intuitive kreative kontroller i ét kraftfuldt kreativt værktøj — designet til skabere, der kræver professionelle resultater uden kompleksiteten i traditionelle produktionsworkflows.
A woman kneeling in darkness, illuminated by a warm, radiant beam of light emerging from her raised hand.
Beskriv din videoscene med bevægelse, kameravinkler og stemning
Modellen skaber cinematisk bevægelse med naturlig fysik og belysning
Download og del din produktionsklare video
Demonstrerer modelens realistiske fysiksimulation og atmosfæriske dynamik — renderer overbevisende vejrsystemer, dyrebevægelser og dramatiske miljøtransformationer med Netflix-kvalitets biografisk sprog og indbygget lyd.
Viser Seedance 2.0's præcision med objekt-fysik, væskedynamik, makro-niveau detaljer og sømløse stiliseret overgange — ideelt til luksus-produkt-biografi med synkroniseret foley og atmosfærisk lyd.
“Cinematic reveal of a sleek black luxury sports car in a dark studio. Camera starts close on the chrome badge, slowly pulling back while orbiting 180 degrees around the vehicle. Dramatic rim lighting gradually intensifies, highlighting the car's sculptural curves and glossy finish. Reflections dance across the body as the camera moves. Dust particles float in volumetric light beams. Final wide shot reveals the full silhouette against a gradient backdrop. 8 seconds, smooth motion, 24fps cinematic quality.”
Skift til resonementsvejledt syntese i dag

Fast, high-quality text-to-video
2.1 kreditter

High-quality, fast video generation
2 kreditter

Fast cinematic video with audio
0.1 kreditter
![Kling Video v3 Text to Video [Standard]](/marketing-assets/_next/image?url=https%3A%2F%2Fv3b.fal.media%2Ffiles%2Fb%2F0a8cfc9f%2Fdei5OqFRB9HK8AgSHwk8f_9a5eea197b3045d1be55aedb0213f6f9.jpg&w=3840&q=75)
Cinematic text-to-video with audio
4.2 kreditter

Cinematic video from references
10 kreditter

Smooth, coherent AI video generation
2 kreditter
![Kling Video v3 Text to Video [Pro]](/marketing-assets/_next/image?url=https%3A%2F%2Fv3b.fal.media%2Ffiles%2Fb%2F0a8cfd13%2Ft6TSkWzl6cFAzvO1PCdDu_f38263f637d245929f03881454951540.jpg&w=3840&q=75)
Cinematic video, fluid motion, audio
4 kreditter

Fast balanced text-to-video generation
1.6 kreditter

Film-grade video with audio
0.1 kreditter