Cinematic video from references
Seedance 2 Reference to Video é o modelo de geração de vídeo mais avançado da ByteDance, concebido para transformar as suas referências criativas — imagens, vídeos e áudio — em saída de vídeo cinematográfica com realismo impressionante. Seja um cineasta a pré-visualizar uma cena, um designer a animar um conceito ou um criador de conteúdo a construir vídeos curtos envolventes, o Seedance 2 oferece-lhe controlo ao nível de realizador sobre todos os aspetos do processo de geração.
No seu núcleo, este modelo destaca-se na criação de vídeo guiada por referências. Em vez de gerar vídeo apenas a partir de texto, pode fornecer até 9 imagens de referência, até 3 vídeos de referência e até 3 ficheiros de áudio para orientar a saída. Isso significa que pode inserir um esboço de personagem, uma fotografia de mood board ou até uma gravação de voz e ver o modelo entrelaçar esses elementos num vídeo coeso e polido. Referencia estes inputs diretamente no seu prompt de texto usando etiquetas simples como @Image1, @Video1 ou @Audio1, dando-lhe controlo preciso sobre a influência de cada ativo no resultado final.
Uma das capacidades mais destacadas do Seedance 2 é a geração nativa de áudio. O modelo não produz apenas clipes mudos — cria paisagens sonoras totalmente sincronizadas, incluindo sons ambiente, efeitos sonoros e fala sincronizada com os lábios. Isto está ativado por predefinição, pelo que os seus vídeos ganham vida com áudio que corresponde à ação no ecrã logo desde o início. Se preferir trabalhar com material sem som, pode simplesmente desativar a geração de áudio.
O modelo produz vídeos com simulação de física do mundo real, o que significa que o movimento, a gravidade, a dinâmica de fluidos e as interações de objetos parecem naturais e credíveis. Combinado com a sua qualidade visual cinematográfica, isso torna o Seedance 2 particularmente adequado para narrativas, visualização de produtos, conteúdo para redes sociais e qualquer projeto onde o acabamento visual seja importante.
Tem controlo flexível sobre o formato e a duração da sua saída. Os vídeos podem ser gerados com durações entre 4 e 15 segundos, ou pode deixar o modelo determinar automaticamente a duração ideal com base no seu prompt. As opções de rácio de aspeto são igualmente versáteis: escolha 16:9 para paisagem/tradicionais ecrãs largos, 9:16 para conteúdo vertical perfeito para plataformas sociais, 1:1 para formatos quadrados, 4:3 ou 3:4 para proporções clássicas, 21:9 para composições cinematográficas ultralargas, ou deixe o modelo decidir automaticamente. As opções de resolução incluem 480p para geração mais rápida ao iterar ideias e 720p para um equilíbrio entre qualidade e velocidade.
O sistema de referência é notavelmente flexível. Para imagens, os formatos suportados incluem JPEG, PNG e WebP, com cada ficheiro até 30 MB. Os vídeos de referência aceitam formatos MP4 e MOV, com uma duração combinada entre 2 e 15 segundos e um tamanho total inferior a 50 MB. Cada vídeo de referência deve ter uma resolução aproximadamente entre 480p e 720p. As referências de áudio suportam formatos MP3 e WAV, com até 15 segundos de duração combinada e um máximo de 15 MB por ficheiro. Nota importante: se incluir referências de áudio, deve também fornecer pelo menos uma imagem ou vídeo de referência. O número total de ficheiros de referência de todos os tipos não pode exceder 12.
Este sistema de input multimodo abre fluxos de trabalho criativos poderosos. Imagine carregar uma foto de um personagem, um clipe curto a mostrar um estilo de movimento específico e uma gravação de voz — depois escrever um prompt que junta os três num cena animada perfeita. A capacidade do modelo para lidar com conteúdo estilizado e transformações torna-o ideal para projetos que vão desde estéticas realistas de ação ao vivo até animações artísticas altamente estilizadas.
Para criadores a trabalhar em projetos de sincronização labial, o Seedance 2 é particularmente capaz. Pode fornecer áudio de diálogo ou canto e imagens de referência de um personagem, e o modelo gerará vídeo com movimentos de boca e expressões precisamente sincronizados. Isso torna-o uma ferramenta poderosa para animação, avatares virtuais, vídeos musicais e conteúdo dobrado.
Pode definir um valor de seed para reprodutibilidade, permitindo regenerar resultados semelhantes ao refinar o seu trabalho. No entanto, note que os resultados podem variar ligeiramente mesmo com o mesmo seed, pelo que deve tratá-lo como um guia em vez de uma garantia de saída idêntica.
O modelo brilha verdadeiramente para profissionais criativos que querem ir além de imagens estáticas para conteúdo dinâmico e orientado por histórias. Cineastas podem usá-lo para pré-visualizar cenas antes de comprometerem-se com produções dispendiosas. Designers podem dar vida a conceitos de produtos com movimento realista. Criadores de redes sociais podem produzir conteúdo vertical que para o scroll. Animadores podem prototipar rapidamente movimentos de personagens e cenas. E músicos ou podcasters podem gerar acompanhamentos visuais para o seu conteúdo áudio.
Seedance 2 Reference to Video representa um avanço significativo na criação de vídeo assistida por IA, combinando flexibilidade de input multimodo, síntese nativa de áudio, física realista e qualidade visual cinematográfica numa única ferramenta de geração versátil. A sua capacidade para aceitar e combinar inteligentemente referências de texto, imagem, vídeo e áudio destaca-o como um dos modelos de geração de vídeo mais completos disponíveis para profissionais criativos hoje.
A woman kneeling in darkness, illuminated by a warm, radiant beam of light emerging from her raised hand.
Descreva a cena do seu vídeo com movimento, ângulos de câmara e ambiente
O modelo cria movimento cinematográfico com física e iluminação natural
Descarregue e partilhe o seu vídeo pronto para produção
Destaca o controlo de câmara ao nível de realizador do Seedance 2 com movimentos de câmara multi-etapa complexos, simulação de tempo atmosférico e dinâmicas de cena em escala de paisagem adequadas para cinematografia de viagem em ecrã largo.
Demonstra a capacidade do Seedance 2 para lidar com transições de cena complexas, física estilizada (vidro estilhaçado, detritos flutuantes) e coreografia dramática de iluminação — mostrando a capacidade narrativa de cut-scene para produção de vídeos musicais.
Mostra o motor de física do mundo real do Seedance 2 e geração nativa de áudio com design sonoro ambiental (neve estaladiça, vento, respiração) — demonstrando imagens de documentário de natureza de qualidade Netflix com movimento preciso de animais e dinâmicas atmosféricas.
“Cinematic reveal of a sleek black luxury sports car in a dark studio. Camera starts close on the chrome badge, slowly pulling back while orbiting 180 degrees around the vehicle. Dramatic rim lighting gradually intensifies, highlighting the car's sculptural curves and glossy finish. Reflections dance across the body as the camera moves. Dust particles float in volumetric light beams. Final wide shot reveals the full silhouette against a gradient backdrop. 8 seconds, smooth motion, 24fps cinematic quality.”
Mude para a síntese guiada por raciocínio hoje

Fast balanced text-to-video generation
1.6 créditos

Smooth, coherent AI video generation
2 créditos

Character-driven video from references
2 créditos

Cinematic video from references
0.4 créditos
![Kling Video v3 Text to Video [Standard]](/marketing-assets/_next/image?url=https%3A%2F%2Fv3b.fal.media%2Ffiles%2Fb%2F0a8cfc9f%2Fdei5OqFRB9HK8AgSHwk8f_9a5eea197b3045d1be55aedb0213f6f9.jpg&w=3840&q=75)
Cinematic text-to-video with audio
4.2 créditos

Film-grade video with audio
0.1 créditos

Stylish text-to-video generation
0.1 créditos

High-quality, fast video generation
2 créditos

Cinematic video with native audio
1.4 créditos