Cinematic video from references
Seedance 2.0 Fast Reference to Video は、ByteDance の最も先進的なビデオ生成モデルで、テキストプロンプト、参照画像、参照ビデオ、さらにはオーディオ入力の柔軟な組み合わせから、豊かで同期されたオーディオ付きの映画品質のビデオを必要とするクリエイターのために特化して構築されています。映画製作者がシーンをプレビューする場合、デザイナーがコンセプトをアニメーション化する場合、またはコンテンツクリエイターがスクロールを止めるソーシャルメディアクリップを作成する場合など、このモデルはあなたのビジュアルストーリーテリングに対するディレクターレベルの制御を提供します。
その核心において、Seedance 2.0 Fast Reference to Video は、あなたのクリエイティブなビジョンを現実世界の物理法則、自然な動き、本格的なオーディオ生成を備えた洗練されたビデオ出力に変換します。これを際立たせるのは、マルチモーダル参照システムです:最大9枚の参照画像、最大3本の参照ビデオ、最大3つのオーディオファイルを供給し、それらをテキストプロンプトに直接織り交ぜて生成をガイドできます。例えば、キャラクターのポートレート、背景環境の写真、ボイスオーバークリップをアップロードし、プロンプトで各入力を自然に参照しながらモデルに組み合わせ方を正確に指示できます。これにより、ストーリーボードを具現化したり、スタイライズドアニメーションを作成したり、リップシンク付きトーキングヘッドビデオを制作したりするのに、極めて強力なツールとなります。
モデルの本格オーディオ生成はデフォルトで有効で、画面の視覚アクションに同期した効果音、周囲音響、リップシンクされたスピーチを生成します。つまり、生成されたビデオはすぐに使用可能 — ポストプロダクションでオーディオを調達したり手動同期したりする必要はありません。サイレントビデオを好む場合や独自のオーディオトラックを追加する場合は、オーディオ生成を単にオフにできます。
Seedance 2.0 は、出力をお好みにぴったり調整できる多様なクリエイティブコントロールを提供します。アスペクト比は7つのオプションから選択:標準ランドスケープおよびワイドスクリーンコンテンツ向けの 16:9、TikTok や Instagram Reels などのソーシャルプラットフォームに最適な縦型/ポートレート向けの 9:16、正方形フォーマット向けの 1:1、クラシックおよび縦長構成向けの 4:3 および 3:4、フィルムスタイルのシーケンスに理想的なウルトラワイドシネマティック向けの 21:9、またはプロンプトに基づいてモデルがインテリジェントに決定する auto。ビデオの長さも柔軟で、4〜15秒の範囲、またはプロンプトで記述されたナラティブに基づいてモデルが理想的な長さを決定する auto オプションがあります。解像度は品質と生成速度のバランスを取る 720p、または高速結果を求める場合の 480p に設定可能 — 最終レンダリング前にアイデアを素早くイテレーションしてプレビューするのに便利です。
参照ベースのワークフローが、このモデルがクリエイティブプロフェッショナルに輝く部分です。参照画像(JPEG、PNG、または WebP、1ファイルあたり最大 30 MB)をアップロードすることで、モデルの視覚スタイル、キャラクターの外見、シーン構成をガイドできます。参照ビデオ(MP4 または MOV、合計長さ 2〜15秒)でモーション参照、ペースングキュー、既存フッテージを基に構築できます。参照オーディオファイル(MP3 または WAV、合計最大 15秒)はリップシンクアニメーションを駆動したり、シーンの音響トーンを設定したり — オーディオ入力には少なくとも1つの参照画像またはビデオが必要です。全入力タイプで最大12ファイルまで組み合わせられ、膨大なクリエイティブの自由度を提供します。プロンプト内で @Image1、@Video2、@Audio1 などの自然なタグを使って各参照を参照し、最終出力への影響をモデルに指示します。
このモデルは特にキャラクターアニメーション、VFX プレビジュアライゼーション、ミュージックビデオコンセプト、製品デモンストレーション、ソーシャルメディアコンテンツ、ナラティブ短編映画に適しています。スタイライズドコンテンツ、トランスフォーメーション、リップシンクの強みが、これらのジャンルで活躍するクリエイターの最適選択となります。現実世界の物理シミュレーションにより、物体は落ち、水は流れ、キャラクターは信ぴょう性のある重さと勢いで動き、典型的な AI ビデオを超えた映画的な洗練を生成コンテンツに与えます。
再現性のために、シード値を設定して複数回の実行で類似結果を生成でき、コンセプトのイテレーションで一貫した出力を得るのに役立ちます。同じシードでも、生成間でわずかな変動が生じる場合があります。
実用的考慮点として:参照ビデオは約 480p〜720p 解像度が最適です。個別画像ファイルは最大 30 MB、全ビデオ参照の合計サイズは 50 MB 未満、各オーディオファイルは 15 MB 以内。全ファイル数(画像、ビデオ、オーディオ合計)は12を超えないように。これらのガイドラインを守ることで、モデルが参照を効果的に処理し、最高品質の出力を届けます。
Seedance 2.0 Fast Reference to Video は、手軽で高品質なビデオ生成の大きな飛躍を表します。マルチモーダル入力の柔軟性、映画的な視覚品質、リップシンク付き本格オーディオ、直感的なクリエイティブコントロールを1つの強力なツールに統合 — 伝統的な制作ワークフローの複雑さなしにプロフェッショナルな結果を求めるクリエイターのために設計されています。
A woman kneeling in darkness, illuminated by a warm, radiant beam of light emerging from her raised hand.
動き、カメラアングル、ムードで動画シーンを記述
モデルは自然な物理と照明でシネマティックな動きを作成
制作に使える動画をダウンロードして共有
現実世界物理シミュレーションと雰囲気ダイナミクスを実証 — Netflix 品質のシネマティック表現と本格オーディオで、信ぴょう性のある天候システム、動物の動き、劇的な環境変容をレンダリング。
Seedance 2.0 の物体物理、液体ダイナミクス、マクロ詳細、シームレスなスタイライズド・トランジションの精度を披露 — 同期フーリーと雰囲気オーディオ付きの高級製品シネマトグラフィに最適。
“Cinematic reveal of a sleek black luxury sports car in a dark studio. Camera starts close on the chrome badge, slowly pulling back while orbiting 180 degrees around the vehicle. Dramatic rim lighting gradually intensifies, highlighting the car's sculptural curves and glossy finish. Reflections dance across the body as the camera moves. Dust particles float in volumetric light beams. Final wide shot reveals the full silhouette against a gradient backdrop. 8 seconds, smooth motion, 24fps cinematic quality.”
今日から推論ガイダンス合成に切り替えよう

Character-driven video from references
2 クレジット

Stylish text-to-video generation
0.1 クレジット

Cinematic video with native audio
1.4 クレジット

Fast cinematic video with audio
0.1 クレジット
![Kling Video v3 Text to Video [Standard]](/marketing-assets/_next/image?url=https%3A%2F%2Fv3b.fal.media%2Ffiles%2Fb%2F0a8cfc9f%2Fdei5OqFRB9HK8AgSHwk8f_9a5eea197b3045d1be55aedb0213f6f9.jpg&w=3840&q=75)
Cinematic text-to-video with audio
4.2 クレジット

Cinematic video from references
10 クレジット

Film-grade video with audio
0.1 クレジット

Smooth, coherent AI video generation
2 クレジット

Fast, high-quality text-to-video
2.1 クレジット