Apresentamos o Seedance 2 Reference to Video

Seedance 2 Reference to Video

Blend up to 9 images, 3 videos, and 3 audio clips into one scene

Cinematic video from references

CONTEÚDO MODA EM VÍDEO

CONTEÚDO DE DANÇA VIRAL

REVELAÇÃO DE PRODUTO ASMR

Seedance 2 Reference to Video é o modelo de vídeo guiado por referências mais avançado da ByteDance, criado para criadores que querem orientar uma geração com material de origem real, em vez de depender apenas de texto. Em vez de descrever tudo em palavras e esperar que o modelo interprete corretamente, pode fornecer até nove imagens de referência, três vídeos de referência e três faixas de áudio e referenciá-los diretamente no seu prompt usando etiquetas simples como @Image1, @Video2 ou @Audio3. O resultado é um vídeo que incorpora as personagens, cenários, estilos, movimentos e sons que indicar — com áudio sincronizado nativo e controlo cinematográfico da câmara incluídos.

No seu núcleo, este é um modelo de texto-para-vídeo, por isso cada geração começa com um prompt escrito. É no prompt que descreve a história, a ação, os planos e como tudo se junta. Um exemplo mostra o alcance: um polvo a encontrar uma bola de futebol no oceano, chama os amigos e corta para um jogo de futebol subaquático completo. Descreve as cenas, alterna entre elas e define o ambiente — o modelo transforma tudo em imagens em movimento. O que distingue esta ferramenta de um simples texto-para-vídeo é o sistema de referências integrado. Ao adicionar as suas próprias imagens e sons e chamá-los no prompt, tem muito mais controlo sobre o que aparece em ecrã.

As imagens de referência aceitam ficheiros JPEG, PNG e WebP, até nove, com um máximo de 30 MB cada. Use-as para bloquear o aspeto de uma personagem, uma localização específica, um produto, um guarda-roupa ou um estilo artístico. Os vídeos de referência aceitam MP4 e MOV, até três clips com uma duração combinada entre 2 e 15 segundos. Estes são úteis para transportar movimento, ritmo ou um comportamento visual específico para o novo vídeo. Os áudios de referência aceitam MP3 e WAV, até três ficheiros com duração total de 15 segundos — perfeito para conduzir falas, música ou ambiente. Regra importante: se fornecer áudio, deve incluir pelo menos uma imagem ou vídeo de referência. No total, pode anexar até doze ficheiros por geração, entre todos os tipos.

O áudio é uma componente central do output. Por predefinição, o modelo gera áudio sincronizado para acompanhar o vídeo, incluindo efeitos sonoros, sons ambiente e fala sincronizada com o movimento dos lábios. Ou seja, uma personagem a falar pode ter os movimentos boca correspondentes à fala gerada, e os sons de ambiente são integrados automaticamente. Se preferir um clip silencioso para adicionar som depois, basta desativar a geração de áudio.

Tem controlo direto sobre o aspeto e a duração do vídeo final. As opções de resolução vão desde 480p para rascunhos rápidos, a 720p como valor equilibrado padrão, 1080p para qualidade superior e até 4k para a máxima fidelidade. A duração é flexível, de 4 a 15 segundos, ou pode deixar o modelo decidir o comprimento ideal com base no seu prompt, colocando em automático. O formato também é versátil: escolha 16:9 para horizontal, 9:16 para vertical e redes sociais, 1:1 para quadrado, 4:3 ou 3:4 para composição clássica, 21:9 para plano ultra panorâmico ou automático para o modelo escolher o que melhor se adapta à cena. Para entrega final, pode optar por uma versão de qualidade superior e ficheiro maior para o melhor resultado, ou manter a versão padrão para uso diário.

Este modelo é indicado para um vasto leque de profissionais criativos. Realizadores e artistas de vídeo podem criar storyboard e protótipos de sequências cinematográficas com movimento real de câmara e cortes de cena. Criadores de conteúdos e produtores para redes sociais podem gerar vídeos verticais com fala sincronizada num só clique. Designers e marketeers podem inserir imagens de produto ou marca como referência, para manter uma campanha consistente. Animadores e criadores de conteúdos estilizados podem transformar referências em novos movimentos, e qualquer pessoa a desenvolver histórias de personagens pode usar referências para manter uma personagem reconhecível na cena. As etiquetas stylized, transform e lipsync resumem as áreas fortes: transformar referências em novas imagens estilizadas e criar discurso sincronizado.

Algumas recomendações práticas ajudam a trabalhar com o modelo: mantenha-se dentro dos limites de ficheiro — no máximo nove imagens, três vídeos entre 2 e 15 segundos e resolução entre 480p e 720p, três áudios com máximo de 15 segundos no total e doze ficheiros no total. Refira sempre os ficheiros no prompt com as etiquetas @Image, @Video e @Audio para indicar ao modelo como usar cada referência. Lembre-se que referências de áudio exigem pelo menos uma imagem ou vídeo. Resoluções mais baixas como 480p são ideais para testes e iteração rápida, enquanto 1080p e 4k devem ser reservados para o render final. Como o modelo pode decidir a duração e formato automaticamente, deixar ambas em automático é um bom ponto de partida quando está a explorar e, depois, selecionar valores fixos quando souber o formato exato que pretende.

No geral, Seedance 2 Reference to Video foi criado para quem procura a flexibilidade de prompts de vídeo aliada à precisão de referências reais — combinando as suas próprias imagens, vídeos e som num só clip coerente, com áudio sincronizado e controlo cinematográfico sobre enquadramento, duração e qualidade.

Gere com o modelo de vídeo mais avançado

A woman kneeling in darkness, illuminated by a warm, radiant beam of light emerging from her raised hand.

Passo 1

Escreva o seu cenário

Descreva a cena do seu vídeo com movimento, ângulos de câmara e ambiente

Passo 2

A IA gera

O modelo cria movimento cinematográfico com física e iluminação naturais

Passo 3

Comece a partilhar

Transfira e partilhe o seu vídeo pronto para produção

Para além do prompt: um novo nível de controlo

FILME DE VIAGEM CINEMATOGRÁFICO

Destaca o controlo de câmara ao nível de realizador do Seedance 2, com movimentos de câmara multi-etapa, simulação atmosférica de clima e dinâmicas de paisagem dramáticas, ideal para cinematografia de viagens em ecrã panorâmico.

ESTÉTICA DE VÍDEO MUSICAL

Demonstra a capacidade do Seedance 2 para gerir transições complexas de cena, física estilizada (vidro a partir, destroços a flutuar) e coreografia de luz dramática — mostrando a sua aptidão para narrativas de vídeo musical de segmentos.

CENA DE DOCUMENTÁRIO NATUREZA

Destaca o motor de física realista e a geração nativa de áudio do Seedance 2, com design de som ambiental (neve a estalar, vento, respiração) — demonstrando imagens de documentário de natureza com qualidade Netflix, movimento preciso de animais e dinâmicas atmosféricas.

Compare com modelos semelhantes

“Cinematic reveal of a sleek black luxury sports car in a dark studio. Camera starts close on the chrome badge, slowly pulling back while orbiting 180 degrees around the vehicle. Dramatic rim lighting gradually intensifies, highlighting the car's sculptural curves and glossy finish. Reflections dance across the body as the camera moves. Dust particles float in volumetric light beams. Final wide shot reveals the full silhouette against a gradient backdrop. 8 seconds, smooth motion, 24fps cinematic quality.”

Atual

Seedance 2 Reference to Video

Seedance 2.0 Fast Reference to Video

Veo3.1 Lite Text to Video

Seedance 2.0 Fast Text to Video

Kling Video v3 Text to Video [Standard]

LTX-2.3 22B

PixVerse C1 Text To Video

Seedance 2.0 Text to Video API