Character-driven video from references
Wan 2.7 Reference to Video は、最新世代の AI ビデオモデルで、参照画像、ビデオ、テキストプロンプトを驚くほどの一貫性のある美しいビデオコンテンツに変換します。キャラクターやシーンを一貫性とシネマティックな品質で命を吹き込む必要があるクリエイター向けに設計されており、提供した被写体の外見を忠実に保持したビデオ生成に優れています。特定のキャラクター、物体、または独自のビジュアル参照から抽出したスタイライズされたルックなどです。
このモデルの核心は、AI ビデオ生成の最も困難な問題の一つである、フレームやショット間の視覚的アイデンティティの維持を解決することです。キャラクターや物体の参照画像やビデオをアップロードすることで、モデルに明確な視覚的アンカーを与えます。これに記述的なテキストプロンプトを組み合わせると、Wan 2.7 は従来の世代を上回る動きの滑らかさ、優れたシーン忠実度、より高い視覚的一貫性を備えたビデオを生成します。結果として、意図的で洗練されたビデオコンテンツが生まれ、ランダムや不一致がありません。
このモデルは誰向けか?
Wan 2.7 Reference to Video は、多様なクリエイティブプロフェッショナル向けに構築されています。映画製作者やビデオプロデューサーは、シーンを迅速にプロトタイプ化したり、ストーリーボードをプレビジュアライズしたり、一貫したキャラクターをフィーチャーした補足映像を生成したりできます。アニメーターやモーションデザイナーは、参照画像を活用して複数の生成クリップ間でキャラクターのルックを維持できます。ソーシャルメディア、ミュージックビデオ、ブランドコンテンツを手がけるコンテンツクリエイターは、数枚の参照素材と記述からスタイライズされた目を引くビデオを制作できます。コンセプトアーティストやデザイナーは、静止アートワークをモーションに変換する様子を探求し、本格的な制作パイプラインに進む前にシネマティックなアイデアをテストできます。
何を作成できるか
このモデルは最大 1080p 解像度のビデオを生成し、プロフェッショナルな用途に適した鮮明な高精細出力を提供します。高速イテレーションや小さいファイルサイズを好む場合は 720p を選択できます。ビデオの長さは 2 〜 10 秒の範囲で、素早いモーションスニペットから発展したシーンまで簡単に生成できます。
際立った機能の一つが複数のアスペクト比のサポートです。シネマティックや YouTube スタイルのコンテンツに最適なワイドスクリーン 16:9、TikTok や Instagram Reels などのソーシャルプラットフォームにぴったりの縦型 9:16、ソーシャルメディア投稿向けの正方形 1:1、伝統的またはポートレート指向の構成向けの 4:3 や 3:4 を生成できます。この柔軟性により、クロップやリフォーマットなしで任意のプラットフォームやクリエイティブコンテキストに適合させられます。
参照駆動型生成
このモデルを際立たせるのは参照駆動型のアプローチです。ビデオ内のキャラクターや物体の外見を定義するために、1 枚以上の参照画像をアップロードできます。シーンで相互作用する 2 つの異なるキャラクターが必要ですか?それぞれに別々の参照画像を提供するだけで、モデルがマルチ被写体生成を処理します。また、参照ビデオを提供することで、被写体の外見とモーションスタイルの両方をモデルに伝えることができます。これは連続性を維持する上で非常に強力です。同じキャラクターの異なる設定での複数のクリップを生成しても、一貫した見た目になります。
モデルはスタイライズド変換のためのタグやリップシンク機能もサポートし、キャラクターアニメーションや対話駆動型シーンのクリエイティブな可能性を広げます。
クリエイティブコントロール
主なクリエイティブツールはテキストプロンプトで、最大 5,000 文字まで記述可能 — 複雑なシーン、ムード、カメラムーブメント、ナラティブの詳細を十分に記述できます。また、ネガティブプロンプト(最大 500 文字)を使用して、低解像度、視覚アーティファクト、避けたい特定のスタイルなどの望ましくない品質を回避できます。
特にエキサイティングな機能がマルチショットモードです。有効にすると、モデルは単一の連続テイクではなく、ビデオをインテリジェントに複数のショットに分割します。これはナラティブシーケンスやプロフェッショナルにカットされたようなダイナミックな編集を作成するのに最適です。オフにすると、スムーズで途切れのない単一ショットが得られ、確立ショット、キャラクターの登場、流れるようなモーション作品に最適です。
再現性を求めるプロジェクトでは、シード値で特定の結果を固定できます。気に入ったビデオを生成したら、同じシードを使用することで正確に再現 — または同じ視覚基盤を保ちつつプロンプトを微調整できます。これはコンセプトをステップバイステップで洗練するイテレーティブなクリエイティブワークフローに欠かせません。
品質と一貫性
Wan 2.7 は AI ビデオ品質の世代的飛躍を表します。ドキュメントでは 3 つの核心的強みを強調:動きの滑らかさ向上(キャラクターや物体がジッターや不自然なトランジションなしで自然に動く)、優れたシーン忠実度(記述した環境や設定を正確かつ詳細にレンダリング)、より高い視覚的一貫性(ビデオ内の要素がフレームからフレームへ外見と空間関係を維持)。
コンテンツ安全性
モデルにはデフォルトで有効なビルトインのコンテンツモデレーションシステムが含まれており、入力と生成出力をスクリーニングします。これにより、作成するコンテンツが適切な範囲内に収まります。
実践的な考慮事項
参照画像のファイルは 1 つあたり最大 20 MB、参照ビデオは 1 つあたり最大 100 MB です。これらの寛大な制限により、高品質なソース素材を強い圧縮なしで提供できます。テキストプロンプトが望むシーンを明確に記述し、参照素材がフィーチャーしたい被写体のクリーンで明るい描写を提供すると、モデルが最適に動作します。
キャラクター駆動型ナラティブの構築、スタイライズドソーシャルコンテンツの生成、シネマティックシーケンスのプロトタイピング、モーションデザインコンセプトの探求など、Wan 2.7 Reference to Video は驚くべき一貫性と品質でクリエイティブビジョンをムービングイメージに変える強力で柔軟なツールを提供します。
A woman kneeling in darkness, illuminated by a warm, radiant beam of light emerging from her raised hand.
動き、カメラアングル、ムードで動画シーンを記述
モデルは自然な物理と照明でシネマティックな動きを作成
制作に使える動画をダウンロードして共有
今日から推論ガイダンス合成に切り替えよう

Fast, high-quality text-to-video
2.1 クレジット

Fast balanced text-to-video generation
1.6 クレジット

Smooth, coherent AI video generation
2 クレジット
![Kling Video v3 Text to Video [Standard]](/marketing-assets/_next/image?url=https%3A%2F%2Fv3b.fal.media%2Ffiles%2Fb%2F0a8cfc9f%2Fdei5OqFRB9HK8AgSHwk8f_9a5eea197b3045d1be55aedb0213f6f9.jpg&w=3840&q=75)
Cinematic text-to-video with audio
4.2 クレジット

Film-grade video with audio
0.1 クレジット

Fast cinematic video with audio
0.1 クレジット

High-quality, fast video generation
2 クレジット

Cinematic video from references
10 クレジット

Cinematic video from references
0.4 クレジット