Vidu 是一个强大的参考转视频模型,它将您的静态图像转化为由文本提示引导的动态动画视频。基于 Vidu 的最新架构,这个 "Reference to Video Mix" 模型专门设计用于在生成的视频内容中保持主体和场景的视觉一致性——使其成为创作者的绝佳工具,他们需要角色、物体或环境在整个视频输出中保持可识别和品牌一致。
Vidu 的核心是通过结合两种创意输入来工作:参考图像和文本提示。您可以提供最多四张参考图像来确立主体或场景的视觉身份,然后用自然语言描述视频中要发生什么。模型智能融合这些输入,生成流畅的视频,同时保留参考图像的外观和感觉,并将您的书面愿景生动呈现。这使其与纯文本转视频工具根本不同——您不是每次都从零开始,而是基于已建立的视觉基础进行构建。
Vidu 的一个突出特性是其内置音频生成功能。默认情况下,模型会生成带有同步声音的视频,这意味着您的生成片段自带与视觉内容匹配的音频。这是电影制作人、社交媒体创作者以及任何注重声音设计的视频内容生产者的重大创意优势。如果您偏好无声视频——例如用于更大的编辑项目中添加自己的配乐——只需关闭音频选项即可。
模型提供多种输出选项,适应几乎任何创意场景。您可以选择五种宽高比:宽屏 (16:9) 用于电影和 YouTube 风格内容,竖屏 (9:16) 用于 TikTok、Instagram Reels 和移动优先平台,经典 (4:3) 用于更传统的广播风格,肖像 (3:4) 用于风格化的竖直构图,以及正方形 (1:1) 用于社交媒体帖子和平衡布局。这种灵活性意味着单一工作流程即可生成针对多个平台的优化内容,而无需妥协。
分辨率选项从 360p 到完整的 1080p HD,帮助您控制输出质量与特定需求之间的平衡。对于快速预览、概念测试或故事板式探索,低分辨率可让您快速迭代。当准备好最终生产输出时,1080p 提供清晰的高清视频,适合专业使用。默认的 720p 分辨率为大多数创意工作流程提供坚实的中庸选择。
视频时长可从 1 秒到 16 秒完全调整,默认 5 秒。虽然听起来较短,但这些片段是更大项目的理想构建模块——短视频社交内容、动画产品展示、角色介绍序列、场景过渡以及视觉效果元素。对于短视频创作者来说,16 秒通常足以制作一个完整而引人入胜的片段。
您的文本提示可长达 2000 个字符,为描述复杂场景、动作、氛围和细节提供充足空间。无论您写简洁的描述如 "一个角色在海滩上走路接住一个苹果",还是精心制作带有特定灯光、相机移动和情感基调的丰富场景描述,模型都能适应各种提示复杂度。
参考图像系统是 Vidu 在专业创意工作流程中真正闪耀的地方。通过接受 1 到 4 张参考图像,模型实现复杂的主体和场景一致性。想象您为品牌活动开发动画角色——您可以提供该角色的多个视角或姿势作为参考,然后生成它们执行提示中描述的各种动作的视频。这一原理同样适用于产品可视化,其中产品参考图像可动画化为动态展示视频,或环境设计,其中参考景观可通过运动和氛围生动呈现。
对于需要可重现结果的创作者——在团队协作或特定创意方向迭代时至关重要——Vidu 提供种子选项以确保一致性。通过使用相同的种子值和输入,您可以一致地重新生成相同的视频输出。这在创意审查过程中无比宝贵,您需要重现特定结果,或在保持其他创意元素恒定时进行小幅提示调整。
Vidu 的 Reference to Video Mix 模型非常适合广泛的创意专业人士。动态设计师可用于快速原型动画序列。社交媒体经理可从品牌图像生成平台特定视频内容。电影制作人和故事板艺术家可在全面制作前可视化场景。角色设计师可看到静态插图活起来。产品摄影师可将静态镜头转化为引人入胜的视频广告。概念艺术家可探索环境设计在动态中的感觉,配以环境音效。
该模型代表了创意控制与易用性的周到平衡——您提供视觉参考并描述愿景,Vidu 则处理生成连贯、视觉一致的视频(可选音频)、您选择的格式和分辨率的复杂工作。
Add the image that you want change
添加可选图像以引导外观、角色或环境
A woman kneeling in darkness, illuminated by a warm, radiant beam of light emerging from her raised hand.
输入提示 - 模型理解场景的物理、光照和情感意图
点击生成最终输出并下载生产级视频
为郁郁葱葱的森林景观添加体积雾、漂浮光线和有机环境运动,展示理想用于旅行内容、环境视觉和标题序列的电影级自然序列。
从单张产品照片创建高端产品动画,带有动态液体、光折射和优雅相机运动,完美用于电商、奢侈品牌广告和社会商务内容。
为城市夜景添加闪烁霓虹、雨水反射和环境活力,展示模型处理复杂多元素场景和动态灯光的能力,用于电影、音乐视频和创意内容制作。
“Animate with subtle natural movements. Add gentle breathing motion to shoulders. Create natural eye blinks every 2-3 seconds. Introduce slight head micro-movements. Hair moves softly as if in gentle breeze. Maintain the warm smile with subtle lip movements. Eyes should have natural catchlight movement. Keep animation subtle and lifelike, not exaggerated. 5 seconds, smooth looping.”
立即切换到推理引导合成

Animate between first/last frames
1.6 积分

Character-consistent video from references
0.1 积分

Physics-driven video from images
0.4 积分

Cinematic video from your images
0.1 积分

Animate images into smooth video
2 积分

Smooth image-to-image video transitions
0.1 积分

Cinematic video from images fast
0.1 积分

Fast, high-quality image animation
2.1 积分

Animate images into pro videos
1.6 积分