Reference-guided consistent video generation
Vidu adalah model reference-to-video yang kuat yang mengubah gambar diam Anda menjadi video animasi dinamis yang dipandu oleh prompt teks. Dibangun di atas arsitektur terbaru Vidu, model "Reference to Video Mix" ini dirancang khusus untuk menjaga konsistensi visual subjek dan adegan di seluruh konten video yang dihasilkan — menjadikannya alat luar biasa bagi kreator yang membutuhkan karakter, objek, atau lingkungan tetap dikenali dan sesuai merek sepanjang output video mereka.
Pada intinya, Vidu bekerja dengan menggabungkan dua input kreatif: gambar referensi dan prompt teks. Anda menyediakan hingga empat gambar referensi yang menetapkan identitas visual subjek atau adegan Anda, kemudian deskripsikan dalam bahasa alami apa yang ingin Anda lihat terjadi dalam video. Model ini secara cerdas menyatukan input tersebut, menghasilkan video yang mengalir sambil mempertahankan tampilan dan nuansa referensi Anda sekaligus mewujudkan visi tertulis Anda. Hal ini membuatnya secara fundamental berbeda dari alat text-to-video murni — Anda tidak memulai dari nol setiap kali, melainkan membangun atas fondasi visual yang sudah Anda tetapkan.
Salah satu fitur unggulan Vidu adalah generasi audio bawaan. Secara default, model menghasilkan video dengan suara sinkron, artinya klip yang dihasilkan siap dengan audio yang cocok dengan konten visual. Ini adalah keunggulan kreatif yang signifikan bagi pembuat film, kreator media sosial, dan siapa pun yang memproduksi konten video di mana desain suara penting. Jika Anda lebih suka video tanpa suara — mungkin untuk digunakan dalam proyek pengeditan yang lebih besar di mana Anda akan menambahkan soundtrack sendiri — Anda cukup matikan audio.
Model ini menawarkan berbagai opsi output yang serbaguna untuk hampir semua konteks kreatif. Anda bisa memilih dari lima rasio aspek: layar lebar (16:9) untuk konten sinematik dan gaya YouTube, vertikal (9:16) untuk TikTok, Instagram Reels, dan platform mobile-first, klasik (4:3) untuk nuansa siaran tradisional, potret (3:4) untuk komposisi vertikal bergaya, dan persegi (1:1) untuk posting media sosial dan tata letak seimbang. Fleksibilitas ini berarti satu alur kerja bisa menghasilkan konten yang dioptimalkan untuk berbagai platform tanpa kompromi.
Opsi resolusi mencakup dari 360p hingga 1080p HD penuh, memberi Anda kendali atas keseimbangan antara kualitas output dan kebutuhan spesifik Anda. Untuk pratinjau cepat, uji konsep, atau eksplorasi gaya storyboard, resolusi rendah memungkinkan iterasi cepat. Saat siap untuk output produksi akhir, 1080p menghasilkan video tajam definisi tinggi yang cocok untuk penggunaan profesional. Resolusi default 720p menawarkan keseimbangan yang kuat untuk sebagian besar alur kerja kreatif.
Durasi video sepenuhnya dapat disesuaikan dari 1 hingga 16 detik, dengan default 5 detik. Meskipun terdengar singkat, klip ini adalah blok bangunan ideal untuk proyek yang lebih besar — konten sosial bentuk pendek, pameran produk animasi, urutan pengenalan karakter, transisi adegan, dan elemen efek visual. Bagi kreator yang bekerja dengan video bentuk pendek, 16 detik sering kali lebih dari cukup untuk klip yang lengkap dan menarik.
Prompt teks Anda bisa mencapai 2.000 karakter, memberi ruang luas untuk mendeskripsikan adegan kompleks, aksi, suasana, dan detail. Baik Anda menulis sesuatu yang ringkas seperti "Seorang karakter berjalan di pantai sambil menangkap apel" atau menyusun deskripsi adegan yang kaya detail dengan pencahayaan spesifik, gerakan kamera, dan nada emosional, model ini mengakomodasi berbagai tingkat kompleksitas prompt.
Sistem gambar referensi adalah tempat Vidu benar-benar bersinar untuk alur kerja kreatif profesional. Dengan menerima 1 hingga 4 gambar referensi, model memungkinkan konsistensi subjek dan adegan yang canggih. Bayangkan Anda mengembangkan karakter animasi untuk kampanye merek — Anda bisa menyediakan berbagai sudut pandang atau pose karakter tersebut sebagai referensi, lalu menghasilkan video mereka melakukan berbagai aksi yang dijelaskan dalam prompt Anda. Prinsip yang sama berlaku untuk visualisasi produk, di mana gambar referensi produk bisa dianimasikan menjadi video pameran dinamis, atau desain lingkungan, di mana pemandangan referensi bisa dihidupkan dengan gerakan dan suasana.
Bagi kreator yang membutuhkan hasil yang dapat direproduksi — esensial saat berkolaborasi dengan tim atau mengiterasi arah kreatif tertentu — Vidu menyertakan opsi seed untuk konsistensi. Dengan menggunakan nilai seed yang sama bersama input identik, Anda bisa meregenerasi output video yang sama secara konsisten. Ini sangat berharga selama proses review kreatif di mana Anda perlu mereproduksi hasil spesifik, atau saat ingin melakukan penyesuaian kecil pada prompt sambil menjaga elemen kreatif lain tetap konstan.
Model Reference to Video Mix Vidu sangat cocok untuk berbagai profesional kreatif. Desainer gerak bisa menggunakannya untuk memprototipe urutan animasi dengan cepat. Manajer media sosial bisa menghasilkan konten video spesifik platform dari citra merek. Pembuat film dan seniman storyboard bisa memvisualisasikan adegan sebelum berkomitmen pada produksi penuh. Desainer karakter bisa melihat ilustrasi statis mereka menjadi hidup. Fotografer produk bisa mengubah foto diam menjadi iklan video yang menarik. Dan seniman konsep bisa mengeksplorasi bagaimana desain lingkungan mereka terasa saat bergerak, lengkap dengan suara ambient.
Model ini mewakili keseimbangan bijaksana antara kendali kreatif dan kemudahan penggunaan — Anda sediakan referensi visual dan deskripsikan visi Anda, dan Vidu menangani pekerjaan kompleks menghasilkan video koheren yang konsisten secara visual dengan audio opsional, dalam format dan resolusi pilihan Anda.
Add the image that you want change
Tambahkan gambar opsional untuk memandu tampilan, karakter, atau lingkungan
A woman kneeling in darkness, illuminated by a warm, radiant beam of light emerging from her raised hand.
Ketik prompt - Model memahami fisika, pencahayaan, dan niat emosional adegan Anda
Klik untuk menghasilkan output akhir dan unduh video berkualitas produksi
Animasi lanskap hutan lebat dengan kabut volumetrik, sinar cahaya melayang, dan gerakan lingkungan organik, pamerkan urutan alam sinematik ideal untuk konten perjalanan, visual ambient, dan urutan judul.
Ciptakan animasi produk premium dengan cairan dinamis, refraksi cahaya, dan gerakan kamera elegan dari satu foto produk, sempurna untuk e-commerce, iklan merek mewah, dan konten sosial commerce.
Animasi pemandangan malam kota dengan neon berkedip, pantulan basah hujan, dan kehidupan lingkungan, tunjukkan kemampuan model menangani adegan multi-elemen kompleks dengan pencahayaan dinamis untuk film, video musik, dan produksi konten kreatif.
“Animate with subtle natural movements. Add gentle breathing motion to shoulders. Create natural eye blinks every 2-3 seconds. Introduce slight head micro-movements. Hair moves softly as if in gentle breeze. Maintain the warm smile with subtle lip movements. Eyes should have natural catchlight movement. Keep animation subtle and lifelike, not exaggerated. 5 seconds, smooth looping.”
Beralih ke sintesis berpandu penalaran hari ini

Animate images into styled videos
0.1 kredit

Animate images into pro videos
1.6 kredit

Cinematic video from images
10 kredit

Animate between first/last frames
1.6 kredit

Smooth image-to-image video transitions
0.1 kredit

Cinematic video from images fast
0.1 kredit

Physics-driven video from images
0.4 kredit

Character-consistent video from references
0.1 kredit

Cinematic transitions between two images
0.1 kredit