Vidu は、強力な参照画像-to-ビデオモデルで、テキストプロンプトによってガイドされる静止画像をダイナミックでアニメーション化された動画に変換します。Vidu の最新アーキテクチャを基盤としたこの「Reference to Video Mix」モデルは、生成される動画コンテンツ全体で被写体やシーンの視覚的一貫性を維持するよう特別に設計されており、キャラクター、オブジェクト、または環境を動画出力全体で認識可能かつブランドに忠実な状態に保つ必要があるクリエイターにとって優れたツールです。
Vidu の核心は、2つのクリエイティブ入力、参照画像とテキストプロンプトを組み合わせることです。被写体やシーンの視覚的アイデンティティを確立する最大4枚の参照画像を提供し、自然言語で動画で何が起こるかを記述します。モデルはこれらの入力をインテリジェントにブレンドし、参照の外観と雰囲気を保持しつつ記述したビジョンを生き生きと表現した流れるような動画を生成します。これにより、純粋なテキスト-to-ビデオツールとは根本的に異なり、毎回ゼロから始めるのではなく、すでに確立した視覚的基盤を構築します。
Vidu の際立った機能の1つは、内蔵の音声生成です。デフォルトでは、視覚コンテンツに同期したサウンド付きの動画を生成するため、生成されたクリップはすぐに使用可能なオーディオが付属します。これは、映画製作者、ソーシャルメディアクリエイター、サウンドデザインが重要な動画コンテンツを制作するすべての人にとって大きなクリエイティブな利点です。大きな編集プロジェクトで独自のサウンドトラックを追加する場合など、サイレント動画を希望する場合は、音声をオフに切り替えるだけです。
モデルは、ほぼすべてのクリエイティブな文脈に適合する多様な出力オプションを提供します。アスペクト比は5種類から選択可能:シネマティックや YouTube スタイルのコンテンツ向けワイドスクリーン (16:9)、TikTok、Instagram Reels、モバイルファーストプラットフォーム向け縦型 (9:16)、伝統的な放送感のクラシック (4:3)、スタイライズドな縦組成のポートレート (3:4)、ソーシャルメディア投稿やバランスの取れたレイアウト向けスクエア (1:1)。この柔軟性により、1つのワークフローが複数のプラットフォームに最適化されたコンテンツを妥協なく生成できます。
解像度は 360p からフル 1080p HD まで対応し、出力品質とニーズのバランスをコントロールできます。クイックプレビュー、コンセプトテスト、ストーリーボード風の探索には低解像度で高速イテレーションが可能。最終制作出力には、プロフェッショナル使用に適したシャープな高精細動画の 1080p を選択。デフォルトの 720p はほとんどのクリエイティブワークフローに適した中間値です。
動画長は 1 〜 16 秒まで完全に調整可能で、デフォルトは 5 秒です。短く聞こえるかもしれませんが、これらのクリップは大規模プロジェクトの理想的なビルディングブロック — ショートフォームソーシャルコンテンツ、アニメーション付き製品ショーケース、キャラクター紹介シーケンス、シーン遷移、ビジュアルエフェクト要素 — に最適です。ショートフォーム動画を扱うクリエイターにとって、16 秒は完全で魅力的なクリップに十分です。
テキストプロンプトは最大 2,000 文字まで使用可能で、複雑なシーン、アクション、ムード、詳細を十分に記述できます。「ビーチを歩くキャラクターがリンゴをキャッチする」といった簡潔なものから、特定の照明、カメラムーブメント、感情的なトーンを含む詳細なシーン記述まで、幅広いプロンプトの複雑度に対応します。
参照画像システムは、プロフェッショナルなクリエイティブワークフローで Vidu が真価を発揮する部分です。1 〜 4 枚の参照画像を受け付けることで、洗練された被写体とシーンの一貫性を可能にします。ブランドキャンペーン用のアニメーションキャラクターを開発する場合、そのキャラクターの複数ビューやポーズを参照として提供し、プロンプトで記述したさまざまなアクションを実行する動画を生成できます。この原則は、製品の参照画像をダイナミックなショーケース動画にアニメーション化する製品可視化や、参照風景に動きと雰囲気を加えて命を吹き込む環境デザインにも適用されます。
チームコラボレーションや特定のクリエイティブ方向性のイテレーションで再現可能な結果が必要なクリエイター向けに、Vidu は一貫性を確保するシードオプションを備えています。同じシード値と同一入力を用いれば、同じ動画出力を一貫して再生成できます。クリエイティブレビューで特定の結果を再現する必要がある場合や、他の要素を一定に保ちつつプロンプトを微調整する場合に不可欠です。
Vidu の Reference to Video Mix モデルは、幅広いクリエイティブプロフェッショナルに最適です。モーションデザイナーはアニメーションシーケンスを迅速にプロトタイプ化。ソーシャルメディアイマネージャーはブランド画像からプラットフォーム特化の動画コンテンツを生成。映画製作者やストーリーボードアーティストは本格制作前にシーンを可視化。キャラクターデザイナーは静止イラストを生き生きと動かす。製品フォトグラファーは静止ショットを魅力的な動画広告に変換。コンセプトアーティストは環境デザインを動きと環境音付きでモーション体験します。
このモデルは、クリエイティブコントロールと使いやすさの思慮深いバランスを体現 — 視覚参照を提供しビジョンを記述するだけで、Vidu が選択したフォーマットと解像度で、オプションの音声付きの一貫した動画を複雑な生成作業を担います。
Add the image that you want change
外観、キャラクター、環境をガイドする画像を追加(オプション)
A woman kneeling in darkness, illuminated by a warm, radiant beam of light emerging from her raised hand.
プロンプトを入力 - モデルはシーンの物理、法則、照明、感情的な意図を理解
クリックして最終出力を作成し、プロ品質の動画をダウンロード
豊かな森林風景をボリュメトリックフォグ、漂う光線、有機的な環境モーションでアニメーション化。トラベルコンテンツ、アンビエントビジュアル、タイトルシーケンスに理想的なシネマティック自然シーケンスを披露。
単一の製品写真からダイナミックな液体、光屈折、上品なカメラムーブメントでプレミアム製品アニメを作成。Eコマース、ラグジュアリーブランド広告、ソーシャルコマースコンテンツに最適。
都会の夜景をちらつくネオン、雨の反射、環境の生命でアニメーション化。複雑なマルチエレメントシーンをダイナミックライティングで扱う能力をデモし、映画、ミュージックビデオ、クリエイティブ制作に。
“Animate with subtle natural movements. Add gentle breathing motion to shoulders. Create natural eye blinks every 2-3 seconds. Introduce slight head micro-movements. Hair moves softly as if in gentle breeze. Maintain the warm smile with subtle lip movements. Eyes should have natural catchlight movement. Keep animation subtle and lifelike, not exaggerated. 5 seconds, smooth looping.”
今日から推論ガイダンス合成に切り替えよう

Animate images into pro videos
1.6 クレジット

Animate images into styled videos
0.1 クレジット

Cinematic video from images fast
0.1 クレジット

Animate images into smooth video
2 クレジット

Cinematic video from your images
0.1 クレジット

Physics-driven video from images
0.4 クレジット

Fast, high-quality image animation
2.1 クレジット

Cinematic transitions between two images
0.1 クレジット

Cinematic video from images
10 クレジット