Multimodal references to video
Gemini Omni Flash ایک ملٹی موڈل ویڈیو جنریشن ماڈل ہے جو کئی قسم کے تخلیقی ان پٹس کو اکٹھا کرتا ہے تاکہ آواز سمیت مکمل ویڈیو پیدا کرے۔ یہ ایک ہی ذریعے سے کام کرنے کے بجائے متن، تصاویر، آڈیو، اور ویڈیو کو ایک ساتھ قبول کرتا ہے، اور ان ہر حوالے کو استعمال کرتے ہوئے حتمی نتیجے کا موضوع، حرکت، بصری انداز، اور یہاں تک کہ آواز کو تشکیل دیتا ہے۔ یہ تخلیق کاروں کے لیے ایک ورسٹائل ٹول بناتا ہے جو اپنے موجودہ اثاثوں — ایک کردار کی تصویر، ایک فوٹو، ایک حوالہ جاتی کلپ، یا آواز — کو ملا کر ماڈل کو اجازت دیں گے کہ وہ انہیں ایک مربوط متحرک تصویر میں بافت دے۔
اس کے مرکز میں، ماڈل ایک تحریری تفصیل کے ساتھ ایک یا زیادہ حوالہ جاتی تصاویر کے ساتھ کام کرتا ہے۔ آپ اپنے ذہن میں موجود منظر، عمل، یا موڈ کی تفصیل دیں — مثال کے طور پر، "ایک بلی جو دھوپ والے لاؤンジ میں اون کی گڈی سے کھیلتے ہوئے ہاتھ مارتا ہے" — اور وہ تصاویر فراہم کریں جو آپ شامل کرنا چاہتے ہیں۔ ماڈل پھر ایک ویڈیو پیدا کرتا ہے جو آپ کے الفاظ اور آپ کی بصری حوالوں دونوں کو ظاہر کرتی ہے۔ آپ ایک جنریشن میں دس تک حوالہ جاتی تصاویر شامل کر سکتے ہیں، جو آپ کو ویڈیو کے لُک اور مواد کو رہنمائی کرنے کے لیے کافی جگہ دیتی ہے۔ ماڈل آپ کے پرامپٹ کے اندر براہ راست مخصوص حوالہ جاتی تصاویر کو خاص کرداروں سے جوڑنے کی بھی حمایت کرتا ہے، تاکہ آپ درست طور پر بتا سکیں کہ کون سی تصویر منظر کے کس عنصر کو متاثر کرتی ہے۔ یہ تخلیق کاروں کو ان کے حوالوں سے کرداروں، اشیاء، اور سیٹنگز کے حتمی ٹکڑے میں ظاہری شکل پر باریک کنٹرول دیتا ہے۔
کیونکہ Gemini Omni Flash متن، تصاویر، آڈیو، اور ویڈیو کو ان پٹس کے طور پر سمجھتا ہے اور آواز سمیت ویڈیو کو آؤٹ پٹ کے طور پر پیدا کرتا ہے، یہ تخلیقی کاموں کی وسیع رینج کے لیے موزوں ہے۔ ماڈل کو اسٹائلائزڈ ٹرانسفارمیشن اور لپ سنک کام کے لیے نشان زد کیا گیا ہے، یعنی یہ آپ کے حوالوں کو منفرد بصری اندازوں میں دوبارہ تعبیر کر سکتا ہے اور اسکرین پر منہ کی حرکت کے ساتھ بولی یا گائی گئی آڈیو کو ہم آہنگ کر سکتا ہے۔ فلم ساز اور اینیمیشن کار اسے سٹیٹک کرداروں کو ہم آہنگ ڈائلاگ کے ساتھ زندہ کرنے کے لیے استعمال کر سکتے ہیں، جبکہ موسیقار اور مواد تخلیق کار آڈیو کو بصریوں کے ساتھ ملا کر پرفارمنس سٹائل کلپس بنا سکتے ہیں۔ ڈیزائنرز اور مصور اپنے آرٹ ورک کو مختصر اینیمیٹڈ ٹکڑوں میں تبدیل کر سکتے ہیں، اور سوشل میڈیا تخلیق کار تصورات کو تیزی سے شیئر ایبل ویڈیو میں بدل سکتے ہیں۔
ماڈل آپ کو ہر جنریشن کو اپنی مرضی کے مطابق بنانے کے لیے سیدھے سادھے تخلیقی کنٹرولز دیتا ہے۔ آپ اپنی ویڈیو کا پہلو تناسب منتخب کر سکتے ہیں، لینڈ سکیپ اسٹوری ٹیلنگ، سنیماٹک مناظر، اور ڈیسک ٹاپ ویوئنگ کے لیے موزوں وسیع اسکرین 16:9 فارمیٹ کے درمیان، یا موبائل فرسٹ پلیٹ فارمز اور شارٹ فارم سوشل مواد کے لیے مثالی عمودی 9:16 فارمیٹ۔ آپ ویڈیو کی لمبائی بھی سیٹ کر سکتے ہیں، تین سے دس سیکنڈ کی کوئی بھی مدت منتخب کرتے ہوئے، آٹھ سیکنڈ کی ڈیفالٹ کے ساتھ۔ یہ رینج ماڈل کو فوکسڈ لمحے کی اہمیت والے تیز لوپس، سوشل کلپس، ٹیزर्स، اور دیگر شارٹ فارم ویڈیوز کے لیے اچھا فٹ بناتی ہے۔
Gemini Omni Flash کی ایک نمایاں خوبی یہ ہے کہ یہ تصویر کے ساتھ آڈیو بھی پیدا کرتا ہے۔ بہت سے ویڈیو ٹولز خاموش فوٹیج پیدا کرتے ہیں، لیکن یہ ماڈل ایک ہی عمل کا حصہ کے طور پر آواز سمیت ویڈیو بناتا ہے، آپ کی فراہم کردہ آڈیو اور دیگر حوالوں سے صوتی نتیجے کی رہنمائی کرتا ہے۔ اس کی لپ سنک صلاحیت کے ساتھ مل کر، یہ بات کرنے والے کرداروں کے مواد، ڈائلاگ مناظر، اور کسی بھی پروجیکٹ کے لیے خاص طور پر قیمتی بناتا ہے جہاں آواز اور حرکت کو جڑا ہوا محسوس ہونا چاہیے۔ نتیجہ ایک زیادہ مکمل، استعمال کے لیے تیار کلپ ہے جسے کم الگ آڈیو کام کی ضرورت ہوتی ہے۔
ماڈل 720p تک ویڈیو آؤٹ پٹ دیتا ہے، جو سوشل پلیٹ فارمز، پریزنٹیشنز، اور تخلیقی پروجیکٹس کے لیے صاف، اعلیٰ کوالٹی کی تصویر فراہم کرتا ہے۔ حتمی ویڈیو ایک ڈاؤن لوڈ ایبل فائل کے طور پر واپس آتی ہے جسے آپ براہ راست اپنے ایڈیٹنگ ورک فلو میں لا سکتے ہیں یا ویسے ہی شیئر کر سکتے ہیں۔
Gemini Omni Flash سے سب سے زیادہ فائدہ کون اٹھاتا ہے؟ اپنی سٹیٹک تخلیقات کو حرکت اور بولتے دیکھنا چاہنے والے آرٹسٹس اور مصوروں کو یہ قدرتی فٹ ملے گا، جیسا کہ حوالہ آرٹ سے مناظر کو تیزی سے پروٹوٹائپ کرنے والے اینیمیشن کاروں کو۔ فلم ساز اور ویڈیو تخلیق کار اسے اسٹائلائزڈ شاٹس، کردار کے لمحات، اور مختصر بیانیہ بیٹس کے لیے استعمال کر سکتے ہیں۔ موسیقار اور آڈیو تخلیق کار اپنی آواز کو ہم آہنگ بصریوں کے ساتھ ملا سکتے ہیں، اور مارکیٹرز یا سوشل میڈیا مینیجرز افقی اور عمودی فارمیٹس دونوں میں آنکھ پکڑنے والے مختصر کلپس پیدا کر سکتے ہیں۔ کیونکہ یہ ایک ساتھ کئی قسم کے ان پٹس قبول کرتا ہے، یہ ان تخلیق کاروں کو انعام دیتا ہے جن کے پاس پہلے سے تصاویر، آواز، یا حوالہ فوٹیج کی لائبریری ہو اور وہ انہیں کچھ نیا بنانا چاہیں۔
بہترین نتائج حاصل کرنے کے لیے، واضح، تفصیلی پرامپٹس لکھیں جو موضوع، عمل، سیٹنگ، اور مطلوبہ موڈ کو واضح کریں۔ مضبوط حوالہ جاتی تصاویر فراہم کرنا ماڈل کو مزید کام کرنے کے لیے دیتا ہے، اور پرامپٹ میں مخصوص تصاویر کو کرداروں سے جوڑنے کی صلاحیت استعمال کرنا آپ کو درست طور پر بتاتا ہے کہ ہر حوالہ کیسے شراکت کرتا ہے۔ کیونکہ جنریشنز مختصر ہیں — دس سیکنڈ تک — ہر کلپ کو ایک ہی لمحے، عمل، یا خیال پر فوکس کرنا بہتر ہے بجائے طویل سیکوینس کو پکڑنے کی کوشش کے۔ منزل پلیٹ فارم کے لیے صحیح پہلو تناسب کا انتخاب شروع سے وقت بچاتا ہے، کیونکہ 9:16 عمودی موبائل فیڈز کے لیے موزوں ہے جبکہ 16:9 وسیع اسکرین ویوئنگ کے لیے بہتر کام کرتا ہے۔
کوئی بھی شارٹ فارم ویڈیو ٹول کی طرح، کچھ غور طلب باتیں ذہن میں رکھیں۔ ماڈل تین سے دس سیکنڈ کی رینج میں کلپس پیدا کرتا ہے، لہٰذا یہ طویل فارم اسٹوری ٹیلنگ کے بجائے مختصر، اثر انگیز لمحوں کے لیے ڈیزائن کیا گیا ہے۔ آؤٹ پٹ ریزولوشن 720p تک پہنچتی ہے، جو آن لائن شیئرنگ اور تخلیقی کام کے لیے اچھی طرح موزوں ہے۔ دو سپورٹڈ پہلو تناسب سب سے عام افقی اور عمودی ضروریات کو کور کرتے ہیں، لہٰذا اپنی کمپوزیشن کو وسیع اسکرین یا عمودی فریمنگ کے گرد پلان کریں۔ مجموعی طور پر، Gemini Omni Flash شارٹ ویڈیو تخلیق کے لیے لچکدار، ملٹی موڈل اپروچ پیش کرتا ہے، جو آپ کو الفاظ، تصاویر، آواز، اور فوٹیج کو ہم آہنگ آڈیو والے پالشڈ کلپس میں ضم کرنے کی اجازت دیتا ہے — تخلیق کاروں کے لیے ایک طاقتور آپشن جو اپنے حوالوں کو زندہ، بولتی ویڈیو میں تبدیل کرنا چاہتے ہیں۔
Add the image that you want change
ظاہری شکل، کردار یا ماحول کی رہنمائی کے لیے ایک اختیاری تصویر شامل کریں
A woman kneeling in darkness, illuminated by a warm, radiant beam of light emerging from her raised hand.
ایک پرامپٹ ٹائپ کریں - ماڈل آپ کے منظر کی فزکس، روشنی اور جذباتی مقصد کو سمجھتا ہے
اپنا حتمی آؤٹ پٹ تخلیق کرنے اور پروڈکشن گریڈ ویڈیو ڈاؤن لوڈ کرنے کے لیے کلک کریں
وسیع فارمیٹ اسٹوری ٹیلنگ کے لیے ایٹموسفیرک لینڈ سکیپ اینیمیشن کا مظاہرہ، جنریٹڈ ایمبیئنٹ نیچر آواز کے ساتھ۔
لگژری کمرشل ریلز کے لیے حوالہ جاتی تصاویر کو ڈائنامک لائٹنگ اور آواز کے ساتھ ملا کر پریمیم پروڈکٹ اینیمیشن کا مظاہرہ۔
“Animate as a smooth 360-degree rotation on an invisible turntable. Rotate slowly and continuously, taking 6 seconds for full rotation. Light reflections should shift naturally across the metal case and crystal. Maintain consistent dramatic lighting throughout rotation. Add subtle sparkle on diamond indices as they catch light. Keep the background static and dark. Professional product video quality.”
آج ہی ریزننگ پر مبنی سنتھیسس پر سوئچ کریں