Text to video with audio
LTX-2.3 22B एक शक्तिशाली text-to-video मॉडल है जो लिखित विवरणों को पूर्ण रूप से तैयार वीडियो क्लिप्स में बदल देता है — समन्वित ऑडियो सहित। बस अपनी कल्पना के दृश्य का वर्णन करें, और मॉडल इसे जीवंत चलचित्र फुटेज के रूप में प्रस्तुत कर देता है, एक ही चरण में विज़ुअल्स और मेल खाता साउंडट्रैक दोनों उत्पन्न करता है। यह फिल्म निर्माताओं, मोशन डिज़ाइनरों, विज्ञापनदाताओं, सोशल कंटेंट क्रिएटर्स और दृश्य कथावाचकों के लिए आदर्श रचनात्मक साझेदार है जो विचार से तैयार क्लिप तक बिना चित्र और ध्वनि के लिए अलग टूल्स जुटाए पहुंचना चाहते हैं。
मॉडल का केंद्र बिंदु इसकी समृद्ध, सिनेमाई प्रॉम्प्ट्स की व्याख्या करने की क्षमता है। "एक काउबॉय धूल भरे शहर से दोपहर के समय गुजर रहा है, कैमरा पीछे से फॉलो कर रहा है, सिनेमाई गहराई, यथार्थवादी प्रकाश व्यवस्था, वेस्टर्न मूड, 4K फिल्म ग्रेन" जैसा विवरण मॉडल को सुसंगत, वातावरणपूर्ण शॉट रचने के लिए आवश्यक सबकुछ प्रदान करता है। आपका प्रॉम्प्ट जितना अधिक वर्णनात्मक और उद्देश्यपूर्ण होगा — मूड, प्रकाश व्यवस्था, कैमरा व्यवहार और विज़ुअल शैली को समेटते हुए — परिणाम आपकी दृष्टि के उतना ही निकट होगा। अंतर्निहित प्रॉम्प्ट विस्तार सुविधा आपके विवरणों को स्वचालित रूप से समृद्ध कर सकती है, जिससे छोटे प्रॉम्प्ट्स अधिक विस्तृत और पॉलिश्ड परिणाम उत्पन्न करते हैं。
LTX-2.3 22B आपको वीडियो की लंबाई और आकार पर सार्थक नियंत्रण प्रदान करता है। आप कुछ ही फ्रेम्स के बहुत छोटे क्लिप्स से लेकर सैकड़ों फ्रेम्स की लंबी अनुक्रम तक उत्पन्न कर सकते हैं, जिससे त्वरित लूप्स और सोशल स्निपेट्स से लेकर विस्तारित कथा शॉट्स तक सब कुछ बना सकते हैं। फ्रेम रेट भी पूर्णतः समायोज्य है, इसलिए आप अपने प्रोजेक्ट के अनुसार चिकना, सिनेमाई गति या स्टाइलाइज्ड टाइमिंग चुन सकते हैं। डिफ़ॉल्ट सेटिंग 24 फ्रेम्स प्रति सेकंड पर 121-फ्रेम क्लिप उत्पन्न करती है — प्राकृतिक, फिल्म जैसी लय। आप अपना आस्पेक्ट रेशियो भी चुन सकते हैं, जिसमें डिफ़ॉल्ट 16:9 लैंडस्केप फॉर्मेट है जो फिल्म, वेब और सोशल प्लेटफॉर्म्स के लिए उपयुक्त फुटेज आसानी से तैयार करने में सहायक है。
मॉडल की प्रमुख विशेषताओं में से एक है एकीकृत ऑडियो उत्प generation। डिफ़ॉल्ट रूप से हर वीडियो अपने जेनरेटेड साउंडट्रैक के साथ आता है, इसलिए ध्वनि दृश्य के अनुरूप बनाई जाती है न कि बाद में जोड़ी जाती है। आपके पास ऑडियो को आकार देने का अलग रचनात्मक नियंत्रण है, और आप मॉडल द्वारा विज़ुअल्स बनाम ध्वनि पर कितना बल दिया जाए इसका संतुलन कर सकते हैं। यदि आप अपनी संगीत या वॉइसओवर जोड़ने वाले प्रोजेक्ट्स के लिए मौन फुटेज चाहें, तो ऑडियो जेनरेशन को सरलता से बंद किया जा सकता है。
कैमरा भाषा की चिंता करने वाले रचनाकारों के लिए, LTX-2.3 22B में समर्पित कैमरा गति नियंत्रण शामिल हैं जो केवल प्रॉम्प्टिंग से आगे जाते हैं। आप dolly in, dolly out, dolly left, dolly right, jib up, jib down या लॉक्ड स्टेटिक शॉट जैसी विशिष्ट गतियां चुन सकते हैं — और उनकी तीव्रता समायोजित कर सकते हैं। यह कैमरा व्यवहार पर विश्वसनीय, दोहराने योग्य नियंत्रण प्रदान करता है, जो शॉट्स मैच करने, अनुक्रम बनाने या विशेष सिनेमाई अनुभव प्राप्त करने के लिए अमूल्य है。
मॉडल डिफ़ॉल्ट रूप से सक्रिय मल्टी-स्केल जेनरेशन दृष्टिकोण प्रदान करता है। इसके साथ मॉडल पहले वीडियो का छोटा संस्करण बनाता है और फिर उसे बड़े, अधिक परिष्कृत अंतिम रेंडर को निर्देशित करने के लिए उपयोग करता है। परिणाम बेहतर समग्र सुसंगति और समृद्ध विवरण वाला तैयार क्लिप है। अतिरिक्त परिष्करण नियंत्रण आउटपुट को आपके प्रॉम्प्ट से कितना मेल खाता है, सामग्री कितनी केंद्रित और सुसंगत रहती है तथा रेंडर के समग्र विवरण स्तर को समायोजित करने देते हैं। एक वैकल्पिक सैंपलिंग उन्नयन जेनरेशन के दौरान सूक्ष्म विविधता लाकर गुणवत्ता सुधारने में मदद करता है。
एक्सेलेरेशन विकल्प आपको मॉडल द्वारा गति और गुणवत्ता के संतुलन को चुनने की अनुमति देते हैं — कोई एक्सेलेरेशन से पूर्ण एक्सेलेरेशन तक — इसलिए आप अधिकतम निष्ठा या तेज़ प्रक्रिया चुन सकते हैं। आप आउटपुट गुणवत्ता स्तर भी निर्धारित कर सकते हैं — निम्न से अधिकतम तक — और अंतिम फाइल लेखन का तरीका चुन सकते हैं, जिसमें तेज़ प्रोसेसिंग, संतुलित परिणाम या छोटे फाइल आकार को प्राथमिकता देने वाले विकल्प हैं。
अपने तैयार कार्य को वितरित करने में, LTX-2.3 22B विभिन्न वर्कफ़्लो के अनुरूप कई आउटपुट फॉर्मेट्स समर्थन करता है। आप स्टैंडर्ड MP4 वीडियो, WebM, पेशेवर संपादन पाइपलाइनों के लिए उच्च-गुणवत्ता ProRes या हल्के साझाकरण के लिए एनिमेटेड GIFs एक्सपोर्ट कर सकते हैं। यह लचीलापन मॉडल को सोशल पोस्ट में क्लिप सीधे डालने या पेशेवर संपादन सूट में फुटेज लाने दोनों के लिए उपयुक्त बनाता है。
अनचाहे लुक से परिणामों को दूर रखने के लिए, मॉडल डिफ़ॉल्ट नेगेटिव प्रॉम्प्ट का उपयोग करता है जो न्यूज़ प्रसारण शैली, 3D एनिमेशन, वीडियो गेम और कार्टून सौंदर्य, वॉटरमार्क्स, ऑन-स्क्रीन टेक्स्ट, उपशीर्षक तथा अत्यधिक स्थिर या धीमी गति वाले फुटेज जैसी चीजों को हतोत्साहित नहीं करता। यह डिफ़ॉल्ट प्राकृतिक, सिनेमाई, लाइव-एक्शन शैली के परिणामों की ओर निर्देशित करता है। आप इस मार्गदर्शन को अपनी रचनात्मक दिशा के अनुरूप समायोजित कर सकते हैं। एक सेफ़्टी चेकर भी डिफ़ॉल्ट रूप से सक्रिय है जो उत्पन्न सामग्री को उचित रखने में सहायक है। सुसंगति के लिए, आप सीड मान निर्धारित कर सकते हैं, जो किसी विशेष परिणाम को पुनरुत्पादित या संशोधित करने की अनुमति देता है。
LTX-2.3 22B उन रचनाकारों के लिए सबसे उपयुक्त है जो ध्वनि सहित छोटे सिनेमाई वीडियो बनाने का एकल, सुव्यवस्थित तरीका चाहते हैं — अवधारणा फिल्में, मूड टुकड़े, विज्ञापन शॉट्स, संगीत-प्रेरित विज़ुअल्स, एनिमेटिक्स, सोशल कंटेंट और कथा प्रयोग। विस्तृत, भावपूर्ण प्रॉम्प्ट्स पर इसकी उत्कृष्ट प्रतिक्रिया के कारण यह विचारपूर्ण लेखन को पुरस्कृत करता है: प्रकाश व्यवस्था, वातावरण, कैमरा गति और विषय व्यवहार का वर्णन लगातार मजबूत, अधिक उद्देश्यपूर्ण फुटेज देगा। ऑडियो-विज़ुअल जेनरेशन, लचीले फॉर्मेट्स, पेशेवर निर्यात विकल्पों तथा सटीक कैमरा और परिष्करण नियंत्रणों के संयोजन के साथ यह कल्पित दृश्यों को स्क्रीन पर लाने के लिए बहुमुखी उपकरण प्रदान करता है।
A woman kneeling in darkness, illuminated by a warm, radiant beam of light emerging from her raised hand.
अपने वीडियो सीन का वर्णन मोशन, कैमरा एंगल और मूड के साथ करें
मॉडल नैचुरल फ़िज़िक्स और लाइटिंग के साथ सिनेमैटिक मोशन बनाता है
अपना प्रोडक्शन-रेडी वीडियो डाउनलोड करें और शेयर करें
Overhead shot of a sizzling cast iron skillet on gas flame. Fresh vegetables being tossed into the pan creating steam burst. Chef's hands flip ingredients with professional technique. Oil splatters catch the light. Flames briefly flare up. Aromatic herbs sprinkled from above floating down in slow motion. Camera slowly zooms in on the cooking action. Warm kitchen lighting, steam rising. 6 seconds, dynamic motion, appetizing colors.
Tracking shot through a rain-soaked city street at night. Neon signs in Japanese and English reflect in puddles and wet pavement. Camera moves forward at walking pace, passing pedestrians with umbrellas. Steam rises from street vents. Raindrops fall through colorful light beams. Shop windows glow with warm light. Occasional car passes creating light trails. Cyberpunk aesthetic, rich saturated colors. 8 seconds, smooth forward tracking, cinematic atmosphere.
Slow motion fashion video of model walking toward camera on minimalist runway. Dramatic side lighting creates strong shadows on flowing fabric. Hair and dress move elegantly with each step. Camera dollies backward maintaining distance as model approaches. Fabric ripples and catches light. Confident, powerful stride. Shallow depth of field with clean background. Gradual zoom to face reveal. 6 seconds, 60fps slow motion, high fashion aesthetic.
“Cinematic reveal of a sleek black luxury sports car in a dark studio. Camera starts close on the chrome badge, slowly pulling back while orbiting 180 degrees around the vehicle. Dramatic rim lighting gradually intensifies, highlighting the car's sculptural curves and glossy finish. Reflections dance across the body as the camera moves. Dust particles float in volumetric light beams. Final wide shot reveals the full silhouette against a gradient backdrop. 8 seconds, smooth motion, 24fps cinematic quality.”
आज ही रीज़निंग-गाइडेड सिंथेसिस पर स्विच करें

Multi-shot cinematic text-to-video
4 क्रेडिट

Film-grade video with audio
0.1 क्रेडिट

Fast cinematic video with audio
0.1 क्रेडिट

Cinematic video from references
10 क्रेडिट

Cinematic video from references
0.4 क्रेडिट

Fast balanced text-to-video generation
1.6 क्रेडिट

Cinematic video with native audio
1.4 क्रेडिट