Cinematic video from references
Seedance 2.0 Fast Reference to Video è il modello di generazione video più avanzato di ByteDance, progettato appositamente per i creatori che necessitano di video di qualità cinematografica con audio ricco e sincronizzato — tutto generato da una combinazione flessibile di prompt testuali, immagini di riferimento, video di riferimento e persino input audio. Che tu sia un filmmaker che previewa una scena, un designer che anima un concetto o un content creator che produce clip social mozzafiato, questo modello offre un controllo a livello di regista sulla tua narrazione visiva.
Al suo nucleo, Seedance 2.0 Fast Reference to Video trasforma la tua visione creativa in output video raffinato con fisica realistica, movimenti naturali e generazione audio nativa. Ciò che lo distingue è il suo sistema di riferimenti multi-modali: puoi fornire fino a nove immagini di riferimento, fino a tre video di riferimento e fino a tre file audio, poi integrarli direttamente nel tuo prompt testuale per guidare la generazione. Ad esempio, potresti caricare un ritratto di un personaggio, una foto dell'ambiente di sfondo e un clip di voiceover, poi scrivere un prompt che dice al modello esattamente come combinarli — riferendoti a ciascun input in modo naturale nella tua descrizione. Questo lo rende uno strumento straordinariamente potente per dare vita a storyboard, creare animazioni stilizzate e produrre video talking head con lip-sync.
La generazione audio nativa è abilitata per impostazione predefinita e produce effetti sonori sincronizzati, paesaggi sonori ambientali e parlato con lip-sync che corrispondono all'azione visiva sullo schermo. Questo significa che i tuoi video generati arrivano pronti all'uso — non è necessario sourcing o sincronizzazione manuale dell'audio in post-produzione. Se preferisci un video silenzioso o prevedi di aggiungere la tua traccia audio, puoi semplicemente disattivare la generazione audio.
Seedance 2.0 offre un'ampia gamma di controlli creativi versatili che ti permettono di modellare l'output esattamente sulle tue esigenze. Puoi scegliere tra sette opzioni di aspect ratio: 16:9 per contenuti landscape standard e widescreen, 9:16 per video verticali e portrait perfetti per piattaforme social come TikTok o Instagram Reels, 1:1 per formati quadrati, 4:3 e 3:4 per composizioni classiche e alte, 21:9 per formati ultrawide cinematografici ideali per sequenze in stile film, o auto per lasciare che il modello decida intelligentemente in base al tuo prompt. La durata del video è altrettanto flessibile, da 4 a 15 secondi, con un'opzione auto che permette al modello di determinare la lunghezza ideale in base alla narrazione descritta nel tuo prompt. La risoluzione può essere impostata su 720p per un equilibrio tra qualità e velocità di generazione, o 480p quando desideri risultati più rapidi — utile per iterazioni rapide e preview di idee prima di un render finale.
Il workflow basato su riferimenti è dove questo modello brilla davvero per i professionisti creativi. Caricando immagini di riferimento (JPEG, PNG o WebP, fino a 30 MB ciascuna), puoi guidare lo stile visivo del modello, l'aspetto del personaggio o la composizione della scena. I video di riferimento (MP4 o MOV, con durata combinata tra 2 e 15 secondi) ti permettono di fornire riferimenti di movimento, indicazioni di ritmo o footage esistente su cui costruire. I file audio di riferimento (MP3 o WAV, fino a 15 secondi combinati) possono guidare l'animazione lip-sync o impostare il tono sonoro per una scena — anche se gli input audio richiedono almeno un'immagine o video di riferimento insieme. Puoi combinare fino a 12 file totali tra tutti i tipi di input, dandoti una straordinaria libertà creativa. Nel tuo prompt, basta riferirsi a questi input usando tag naturali come @Image1, @Video2 o @Audio1 per indicare al modello come ciascun riferimento debba influenzare l'output finale.
Questo modello è particolarmente adatto per animazione di personaggi, previsualizzazione di effetti visivi, concept di video musicali, dimostrazioni di prodotti, contenuti social e cortometraggi narrativi. I suoi punti di forza in contenuti stilizzati, trasformazione e capacità lip-sync lo rendono una scelta eccellente per creatori che lavorano in questi generi. La simulazione della fisica reale significa che gli oggetti cadono, l'acqua scorre e i personaggi si muovono con peso e momentum credibili, conferendo un polish cinematografico che eleva i contenuti generati oltre il tipico video AI.
Per la riproducibilità, puoi impostare un valore seed per generare risultati simili su più run, utile quando iteri su un concetto e desideri output consistenti. Nota che anche con lo stesso seed, potrebbero verificarsi lievi variazioni tra generazioni.
Alcune considerazioni pratiche da tenere a mente: i video di riferimento dovrebbero essere tra circa 480p e 720p di risoluzione per i migliori risultati. I file immagine individuali possono arrivare a 30 MB, mentre la dimensione totale di tutti i riferimenti video dovrebbe rimanere sotto i 50 MB, e ciascun file audio non più grande di 15 MB. Il numero totale di file tra immagini, video e audio combinati non deve superare 12. Rispettando queste linee guida, il modello può processare i tuoi riferimenti efficacemente e consegnare l'output di qualità più alta.
Seedance 2.0 Fast Reference to Video rappresenta un significativo balzo in avanti nella generazione video accessibile e di alta qualità. Unisce flessibilità di input multimodali, qualità visiva cinematografica, audio nativo con lip-sync e controlli creativi intuitivi in un unico strumento potente — progettato per creatori che esigono risultati professionali senza la complessità dei workflow di produzione tradizionali.
A woman kneeling in darkness, illuminated by a warm, radiant beam of light emerging from her raised hand.
Descrivi la tua scena video con movimento, angolazioni della fotocamera e atmosfera
Il modello crea movimento cinematografico con fisica e illuminazione naturali
Scarica e condividi il tuo video pronto per la produzione
Dimostra la simulazione fisica real-world del modello e le dinamiche atmosferiche — renderizzando sistemi meteorologici credibili, movimenti animali e trasformazioni ambientali drammatiche con linguaggio cinematografico di qualità Netflix e audio nativo.
Mostra la precisione di Seedance 2.0 con fisica degli oggetti, dinamiche liquide, dettagli macro e transizioni stilizzate seamless — ideale per cinematografia di prodotti luxury con foley sincronizzato e audio atmosferico.
“Cinematic reveal of a sleek black luxury sports car in a dark studio. Camera starts close on the chrome badge, slowly pulling back while orbiting 180 degrees around the vehicle. Dramatic rim lighting gradually intensifies, highlighting the car's sculptural curves and glossy finish. Reflections dance across the body as the camera moves. Dust particles float in volumetric light beams. Final wide shot reveals the full silhouette against a gradient backdrop. 8 seconds, smooth motion, 24fps cinematic quality.”
Passa oggi alla sintesi guidata dal ragionamento

Cinematic video from references
10 crediti

Stylish text-to-video generation
0.1 crediti

Smooth, coherent AI video generation
2 crediti

Fast cinematic video with audio
0.1 crediti

Cinematic video with native audio
1.4 crediti

Fast, high-quality text-to-video
2.1 crediti

Character-driven video from references
2 crediti

Film-grade video with audio
0.1 crediti
![Kling Video v3 Text to Video [Standard]](/marketing-assets/_next/image?url=https%3A%2F%2Fv3b.fal.media%2Ffiles%2Fb%2F0a8cfc9f%2Fdei5OqFRB9HK8AgSHwk8f_9a5eea197b3045d1be55aedb0213f6f9.jpg&w=3840&q=75)
Cinematic text-to-video with audio
4.2 crediti