Vidu é um poderoso modelo de referência-para-vídeo que transforma suas imagens estáticas em vídeos dinâmicos e animados guiados por prompts de texto. Construído na arquitetura mais recente do Vidu, este modelo "Reference to Video Mix" é projetado especificamente para manter a consistência visual de sujeitos e cenas em todo o conteúdo de vídeo gerado — tornando-o uma ferramenta excepcional para criadores que precisam que personagens, objetos ou ambientes permaneçam reconhecíveis e fiéis à marca em suas saídas de vídeo.
No cerne, o Vidu funciona combinando duas entradas criativas: imagens de referência e um prompt de texto. Você fornece até quatro imagens de referência que estabelecem a identidade visual de seus sujeitos ou cenas, depois descreve em linguagem natural o que deseja que aconteça no vídeo. O modelo combina inteligentemente essas entradas, gerando vídeos fluidos que preservam a aparência e o feeling de suas referências enquanto dá vida à sua visão escrita. Isso o torna fundamentalmente diferente de ferramentas puras de texto-para-vídeo — você não começa do zero a cada vez, mas constrói sobre uma base visual já estabelecida.
Uma das características de destaque do Vidu é sua geração de áudio integrada. Por padrão, o modelo produz vídeo com som sincronizado, o que significa que seus clipes gerados vêm prontos com áudio que combina com o conteúdo visual. Essa é uma vantagem criativa significativa para cineastas, criadores de redes sociais e qualquer um que produza conteúdo de vídeo onde o design de som importa. Se você preferir vídeo silencioso — talvez para uso em um projeto de edição maior onde adicionará sua própria trilha sonora —, basta desativar o áudio.
O modelo oferece uma versátil gama de opções de saída para se adequar a praticamente qualquer contexto criativo. Você pode escolher entre cinco proporções: widescreen (16:9) para conteúdo cinematográfico e estilo YouTube, vertical (9:16) para TikTok, Instagram Reels e plataformas mobile-first, clássico (4:3) para um feeling mais tradicional de transmissão, retrato (3:4) para composições verticais estilizadas, e quadrado (1:1) para postagens em redes sociais e layouts equilibrados. Essa flexibilidade significa que um único fluxo de trabalho pode produzir conteúdo otimizado para múltiplas plataformas sem compromissos.
As opções de resolução vão de 360p até 1080p HD completo, dando a você controle sobre o equilíbrio entre qualidade de saída e suas necessidades específicas. Para prévias rápidas, testes de conceito ou explorações em estilo storyboard, resoluções mais baixas permitem iterações rápidas. Quando estiver pronto para saída de produção final, 1080p entrega vídeo nítido em alta definição adequado para uso profissional. A resolução padrão de 720p oferece um ótimo meio-termo para a maioria dos fluxos de trabalho criativos.
A duração do vídeo é totalmente ajustável de 1 a 16 segundos, com padrão de 5 segundos. Embora pareça breve, esses clipes são blocos de construção ideais para projetos maiores — conteúdo social de curta duração, showcases animados de produtos, sequências de introdução de personagens, transições de cena e elementos de efeitos visuais. Para criadores trabalhando com vídeo de curta duração, 16 segundos geralmente é mais do que suficiente para um clipe completo e cativante.
Seus prompts de texto podem ter até 2.000 caracteres, dando amplo espaço para descrever cenas complexas, ações, humores e detalhes. Seja escrevendo algo conciso como "Um personagem caminhando pela praia pegando uma maçã" ou criando uma descrição de cena rica em detalhes com iluminação específica, movimento de câmera e tom emocional, o modelo acomoda uma ampla gama de complexidade de prompts.
O sistema de imagens de referência é onde o Vidu realmente brilha para fluxos de trabalho criativos profissionais. Ao aceitar de 1 a 4 imagens de referência, o modelo permite consistência sofisticada de sujeito e cena. Imagine que você está desenvolvendo um personagem animado para uma campanha de marca — você pode fornecer múltiplas visões ou poses desse personagem como referências, depois gerar vídeo deles executando várias ações descritas em seu prompt. O mesmo princípio se aplica à visualização de produtos, onde imagens de referência de um produto podem ser animadas em vídeos de showcase dinâmicos, ou ao design ambiental, onde paisagens de referência podem ganhar vida com movimento e atmosfera.
Para criadores que precisam de resultados reproduzíveis — essencial ao colaborar com equipes ou iterar em uma direção criativa específica —, o Vidu inclui uma opção de seed para consistência. Ao usar o mesmo valor de seed junto com entradas idênticas, você pode regenerar a mesma saída de vídeo de forma consistente. Isso é inestimável durante processos de revisão criativa onde precisa reproduzir um resultado específico, ou quando deseja fazer pequenos ajustes no prompt mantendo outros elementos criativos constantes.
O modelo Reference to Video Mix do Vidu é idealmente adequado para uma ampla gama de profissionais criativos. Designers de motion podem usá-lo para prototipar rapidamente sequências animadas. Gerentes de redes sociais podem gerar conteúdo de vídeo específico para plataformas a partir de imagens de marca. Cineastas e artistas de storyboard podem visualizar cenas antes de se comprometer com produção completa. Designers de personagens podem ver suas ilustrações estáticas ganharem vida. Fotógrafos de produtos podem transformar fotos estáticas em anúncios de vídeo envolventes. E artistas de conceito podem explorar como seus designs ambientais se sentiriam em movimento, completos com som ambiente.
O modelo representa um equilíbrio thoughtful entre controle criativo e facilidade de uso — você fornece as referências visuais e descreve sua visão, e o Vidu cuida do trabalho complexo de gerar vídeo coerente e visualmente consistente com áudio opcional, no formato e resolução escolhidos.
Add the image that you want change
Adicione uma imagem opcional para guiar a aparência, personagem ou ambiente
A woman kneeling in darkness, illuminated by a warm, radiant beam of light emerging from her raised hand.
Digite um prompt - O modelo entende a física, iluminação e intenção emocional da sua cena
Clique para gerar sua saída final e baixar vídeo de qualidade profissional
Anime uma paisagem exuberante de floresta com névoa volumétrica, raios de luz flutuantes e movimento ambiental orgânico, exibindo sequências cinematográficas de natureza ideais para conteúdo de viagem, visuais ambiente e sequências de títulos.
Crie uma animação premium de produto com líquido dinâmico, refrações de luz e movimento elegante de câmera a partir de uma única foto de produto, perfeita para e-commerce, publicidade de marcas de luxo e conteúdo de comércio social.
Anime uma paisagem urbana noturna com neon piscante, reflexos escorregadios de chuva e vida ambiental, demonstrando a capacidade do modelo de lidar com cenas complexas multi-elemento com iluminação dinâmica para cinema, videoclipes e produção de conteúdo criativo.
“Animate with subtle natural movements. Add gentle breathing motion to shoulders. Create natural eye blinks every 2-3 seconds. Introduce slight head micro-movements. Hair moves softly as if in gentle breeze. Maintain the warm smile with subtle lip movements. Eyes should have natural catchlight movement. Keep animation subtle and lifelike, not exaggerated. 5 seconds, smooth looping.”
Mude para síntese guiada por raciocínio hoje

Character-consistent video from references
0.1 créditos

Physics-driven video from images
0.4 créditos

Cinematic video from images fast
0.1 créditos

Smooth image-to-image video transitions
0.1 créditos

Cinematic video from your images
0.1 créditos

Animate between first/last frames
1.6 créditos

Animate images into pro videos
1.6 créditos

Cinematic video from images
10 créditos

Animate images into styled videos
0.1 créditos