Wan Text to Video は、最新世代の AI ビデオモデル(バージョン 2.7)で、書き込んだ説明を完全に実現されたビデオクリップに変換します。映画製作者がシーンをプレビジュアライズする場合、ソーシャルメディアクリエイターが目を引くコンテンツを作成する場合、またはデザイナーがモーションコンセプトを探求する場合でも、このモデルはアイデアをダイナミックで高品質なビデオに変え、モーションの滑らかさが向上し、シーンの忠実度が優れ、視覚的一貫性が強化されています。
基本的に、Wan Text to Video はテキストプロンプト(希望するシーン、ムード、アクション、視覚スタイルの説明)を読んで、それらの言葉を命を吹き込むビデオを生成します。想像するものを単に記述するだけで、モデルが流れるようなモーション、現実的な照明、一貫した環境、フレームごとの一貫した被写体という複雑な作業を処理します。
解像度とフォーマットオプション
Wan Text to Video は最大 1080p の出力解像度をサポートし、プロフェッショナルな用途に適した鮮明で高精細な結果を提供します。高速な結果や小さなファイルサイズを好む場合は 720p を選択できます。モデルは、ほぼすべてのプラットフォームやクリエイティブニーズに合わせた多様なアスペクト比を提供します:シネマティックや YouTube スタイルのコンテンツ向け標準ワイドスクリーン (16:9)、Instagram Reels や TikTok などのモバイルファーストプラットフォーム向け縦型 (9:16)、ソーシャルメディアフィード向け正方形 (1:1)、より伝統的またはポートレート指向の構成向けクラシックフォーマット (4:3 および 3:4)。この柔軟性により、生成後にクロップやリフレームをする必要なく、正確な配信フォーマットに合わせたコンテンツを作成できます。
柔軟なビデオ長
生成ビデオの長さを 2 秒から最大 15 秒まで、1 秒単位で精密に制御できます。この範囲は、クイックなアニメーションループやソーシャルメディアクリップから、より長いシーン予告やモーションコンセプト作品まで作成するのに理想的です。デフォルトの長さは 5 秒で、ほとんどのクリエイティブ探求に最適なバランスを提供します。
オーディオ統合
Wan Text to Video の際立った機能の一つがオーディオ機能です。自分のオーディオファイル(WAV または MP3 形式、3〜30 秒、最大 15 MB)をアップロードしてビデオ生成を駆動できます。これにより、リップシンクコンテンツ、音楽駆動ビジュアル、オーディオ反応シーンなどの強力な可能性が広がります。オーディオを提供しない場合、モデルが自動的にビデオに合う背景音楽を生成し、追加の労力をかけずに出力に洗練されたレイヤーを追加します。
インテリジェントプロンプト強化
モデルには、デフォルトで有効化されたインテリジェントプロンプト書き換え機能が組み込まれており、初期記述を拡張してより豊かで詳細な結果を生み出します。短いまたはカジュアルなプロンプトを書く場合に特に役立ち、モデルがシネマティックな詳細、視覚的手がかり、スタイル要素をインテリジェントに補完して高品質な最終ビデオを生成します。生成後、強化されたプロンプトがどのように見えるかを確認でき、モデルがビジョンをどのように解釈したかの洞察が得られます。記述を完全に制御したい場合は、この機能をオフにできます。
精密のためのネガティブプロンプト
結果をさらに洗練させるために、Wan Text to Video はネガティブプロンプトをサポートします — ビデオに表示したくないものを指定する方法です。例えば、「low resolution, errors, worst quality, low quality」や避けたい他の視覚アーティファクトやスタイルをモデルに指示できます。これにより、不要な要素から出力を導き、意図した美学に向かわせる追加のクリエイティブ制御が得られます。
再現可能な結果
一貫性が必要なクリエイター — コンセプトの反復、関連クリップのシリーズ作成、または他者とのコラボレーション — のために、モデルは再現性を確保するためのシード値をサポートします。同じプロンプトと設定で同じシードを使用することで、同一の結果を再生成でき、アプローチの微調整や特定のルックの再現が容易になります。
スタイライズドで変容的なコンテンツ
Wan Text to Video は、スタイライズドコンテンツ作成と視覚変容に特に適しています。フォトリアリスティックなシネマティクス、アニメーション的美学、ファンタジー環境、抽象的な視覚ストーリーテリングなど、幅広い視覚スタイルを一貫性と芸術性を持って処理するよう設計されています。リップシンク機能も、オーディオと視覚表現を揃えるキャラクター駆動コンテンツに魅力的なツールです。
誰向け?
このモデルは、幅広いクリエイティブプロフェッショナルと愛好家に最適です。映画製作者とビデオエディターは迅速なプロトタイピングとプレビジュアライズに使用できます。ソーシャルメディアクリエイターは任意のプラットフォームフォーマットでスクロールを止めるコンテンツを生成できます。モーションデザイナーは従来のアニメーションソフトウェアに触れずにアニメーションコンセプトを探求できます。ミュージシャンやオーディオアーティストはサウンドに応答し補完するビジュアルを作成できます。そして、クリエイティブなビジョンを持つ誰でも、ビデオ制作経験不要でアイデアをモーションで実現する実験が可能です。
コンテンツ安全性
Wan Text to Video には、デフォルトで有効化された組み込みコンテンツモデレーションシステムがあり、入力と出力が適切であることを確保します。これにより、特にプロフェッショナルまたは公開向けプロジェクトでコンテンツ生成時の安心が得られます。
高精細出力、柔軟なフォーマット、オーディオ駆動生成、インテリジェントプロンプト強化、滑らかなモーション品質の組み合わせにより、Wan Text to Video は書き言葉のアイデアを洗練されたダイナミックなビデオコンテンツに変える強力なクリエイティブツールです。
A woman kneeling in darkness, illuminated by a warm, radiant beam of light emerging from her raised hand.
動き、カメラアングル、ムードで動画シーンを記述
モデルは自然な物理と照明でシネマティックな動きを作成
制作に使える動画をダウンロードして共有
複雑な大気ダイナミクス(渦巻く嵐雲、雨の水面衝撃、劇的照明変化)を優れたシーン忠実度でレンダリング — 大規模環境モーションと天候遷移を披露。
高速移動車両、砂漠の熱歪み、劇的レンズワークでトラッキングショットとモーションをテスト — 速度、風景、シネマティックストーリーテリングを連続シーケンスで融合。
水中物理(流れる布、髪の浮遊、光のコーセティクス、ゆっくり優雅な動き)で Wan 2.7 のモーション滑らかさを限界まで押し — 非標準環境を物理精度でレンダリング。
“Cinematic reveal of a sleek black luxury sports car in a dark studio. Camera starts close on the chrome badge, slowly pulling back while orbiting 180 degrees around the vehicle. Dramatic rim lighting gradually intensifies, highlighting the car's sculptural curves and glossy finish. Reflections dance across the body as the camera moves. Dust particles float in volumetric light beams. Final wide shot reveals the full silhouette against a gradient backdrop. 8 seconds, smooth motion, 24fps cinematic quality.”
今日から推論ガイダンス合成に切り替えよう

High-quality, fast video generation
2 クレジット
![Kling Video v3 Text to Video [Pro]](/marketing-assets/_next/image?url=https%3A%2F%2Fv3b.fal.media%2Ffiles%2Fb%2F0a8cfd13%2Ft6TSkWzl6cFAzvO1PCdDu_f38263f637d245929f03881454951540.jpg&w=3840&q=75)
Cinematic video, fluid motion, audio
4 クレジット

Cinematic video from references
10 クレジット

Fast cinematic video with audio
0.1 クレジット

Film-grade video with audio
0.1 クレジット

Stylish text-to-video generation
0.1 クレジット

Cinematic video from references
0.4 クレジット

Cinematic video with native audio
1.4 クレジット

Fast balanced text-to-video generation
1.6 クレジット