Gemini Omni Flash 是一款多模態影片生成模型,它整合多種創意輸入,產生帶有聲音的完整影片。不像單一來源輸入,它同時接受文字、圖像、音頻和影片,使用這些參考素材來塑造主體、動作、視覺風格,甚至最終結果的音頻。這使其成為創作者的萬用工具,他們可以結合現有資產——角色插圖、照片、參考片段或聲音——讓模型將它們編織成連貫的動態影像。
在核心,它從書面描述搭配一或多張參考圖像運作。您描述想要的場景、動作或氛圍——例如「一隻貓在陽光普照的客廳裡嬉戲地拍打毛線球」——並提供要融入的圖像。模型隨後生成反映您文字與視覺參考的影片。您可以在單次生成中包含最多十張參考圖像,讓您有充分空間引導影片的外觀與內容。模型也支援在提示中直接將特定參考圖像綁定到特定角色,讓您精準控制哪張圖像影響場景的哪個元素。這讓創作者能精細掌控參考中的角色、物件與場景在成品中的呈現。
由於 Gemini Omni Flash 理解文字、圖像、音頻和影片作為輸入,並產生帶音頻的影片輸出,它適合廣泛創意任務。模型標記支援風格化轉換與唇形同步,意味它能將您的參考重新詮釋為獨特視覺風格,並將口語或歌唱音頻與螢幕上的嘴部動作對齊。電影製作者與動畫師可用它讓靜態角色活起來並配對對話,音樂家與內容創作者可將音頻與視覺配對製作表演風格片段。設計師與插畫家可將作品轉為短動畫,社群媒體創作者則能快速將概念轉為可分享影片。
模型提供簡單創意控制,讓您自訂每次生成。您可選擇影片寬高比,選用適合橫向敘事、電影場景與桌面觀看的 16:9 寬銀幕格式,或適合行動優先平台與短形式社群內容的垂直 9:16 格式。您也可設定影片長度,從 3 秒到 10 秒任意選擇,預設 8 秒。此範圍適合快速循環、社群片段、預告與其他短形式影片,重點在於精華時刻而非長度。
Gemini Omni Flash 的亮點之一是它隨畫面生成音頻。許多影片工具僅產出無聲片段,但此模型以單一流程產生帶聲音的影片,依您提供的音頻與其他參考引導聲音結果。結合唇形同步能力,這特別適合對話角色內容、對話場景,以及任何聲音與動作需連貫的專案。結果是更完整、即用片段,減少獨立音頻後製。
模型輸出最高 720p 影片,提供適合社群平台、簡報與創意專案的清晰高品質畫面。成品影片以可下載檔案返回,您可直接帶入編輯流程或原樣分享。
誰最受益於 Gemini Omni Flash?想看靜態創作動起來並說話的藝術家與插畫家會覺得它自然契合,動畫師可用它從參考藝術快速原型場景。電影製作者與影片創作者可用於風格化鏡頭、角色時刻與短敘事節拍。音樂家與音頻創作者可將聲音配對匹配視覺,行銷人員或社群經理則能生成橫豎格式的吸睛短片。由於它同時接受多種輸入,它獎勵擁有圖像、聲音或參考片段庫的創作者,將它們結合成新作。
要獲得最佳結果,請撰寫清晰描述性提示,明確主體、動作、場景與氛圍。提供強力參考圖像給模型更多素材,使用提示中綁定特定圖像到角色的功能,讓您精準導向每個參考的貢獻。由於生成短至 10 秒,最好將每個片段聚焦單一時刻、動作或想法,而非長序列。預先選擇適合目標平台的寬高比也能省時,因為 9:16 適合垂直行動饋送,而 16:9 更適合寬銀幕觀看。
如同任何短形式影片工具,有幾點需注意。模型產出 3 至 10 秒片段,設計用於精煉衝擊時刻而非長篇敘事。輸出解析度達 720p,適合線上分享與創作業。兩種寬高比涵蓋常見橫豎需求,因此預先規劃寬銀幕或垂直構圖。總體而言,Gemini Omni Flash 提供靈活多模態短影片創作方式,讓您融合文字、圖像、聲音與片段成帶同步音頻的精緻片段——適合想將參考轉為活潑有聲影片的創作者。
Add the image that you want change
新增一張選用的圖片,以引導外觀、角色或環境
A woman kneeling in darkness, illuminated by a warm, radiant beam of light emerging from her raised hand.
輸入提示詞——模型能理解您場景中的物理、光線與情感意圖
點擊以生成最終成果,並下載專業等級的影片
展示電影景觀動畫帶氛圍動作與生成自然環境音,適合寬格式敘事。
展示頂級產品動畫,結合參考圖像與動態燈光聲音,製作奢華商業捲軸。
“Animate as a smooth 360-degree rotation on an invisible turntable. Rotate slowly and continuously, taking 6 seconds for full rotation. Light reflections should shift naturally across the metal case and crystal. Maintain consistent dramatic lighting throughout rotation. Add subtle sparkle on diamond indices as they catch light. Keep the background static and dark. Professional product video quality.”
立即切換至推理引導式合成