Text to video with audio
LTX-2.3 22B adalah model text-to-video yang sangat kuat untuk mengubah deskripsi tertulis menjadi klip video nyata — lengkap dengan audio yang sinkron. Cukup gambarkan adegan yang Anda bayangkan, dan model ini akan menghidupkannya sebagai rekaman bergerak, menghasilkan visual sekaligus soundtrack yang sesuai dalam satu langkah. Ini adalah mitra kreatif ideal untuk pembuat film, desainer motion, pengiklan, kreator konten sosial, dan storyteller visual yang ingin mengubah ide menjadi klip siap pakai tanpa harus repot membagi pekerjaan gambar dan suara pada alat terpisah.
Keunggulan utama model ini adalah kemampuannya memahami prompt sinematik yang kaya. Deskripsi seperti "Seorang koboi berjalan di kota berdebu saat tengah hari, kamera mengikuti dari belakang, kedalaman sinematik, pencahayaan realistis, nuansa western, butiran film 4K" sudah cukup bagi model untuk mengatur bidikan yang kohesif dan atmosferik. Semakin detail dan terarah prompt Anda — mencakup suasana, pencahayaan, pergerakan kamera, dan gaya visual — hasilnya akan semakin sesuai dengan visi Anda. Fitur ekspansi prompt bawaan dapat secara otomatis memperkaya deskripsi Anda, membantu prompt pendek menghasilkan hasil yang lebih detail dan halus.
LTX-2.3 22B memberi Anda kendali nyata atas durasi dan bentuk video. Anda bisa membuat klip super pendek hanya beberapa frame, hingga urutan panjang ratusan frame, memungkinkan Anda membuat loop singkat, potongan sosial, hingga shot naratif yang lebih panjang. Frame rate juga sepenuhnya dapat diatur, jadi Anda bisa memilih gerakan yang halus, sinematik, atau timing bergaya sesuai proyek. Pengaturan default menghasilkan klip 121 frame di 24 frame per detik — ritme alami seperti film. Anda juga bisa menentukan rasio aspek, dengan format landscape widescreen 16:9 sebagai default, sehingga mudah untuk bikin footage sesuai film, web, dan platform sosial.
Salah satu fitur unggulan model ini adalah audio terintegrasi. Secara default, setiap video hadir dengan soundtrack yang dihasilkan khusus, sehingga suara dibuat agar pas dengan adegan, bukan ditambahkan setelahnya. Anda punya kontrol kreatif terpisah untuk membentuk audio dan menyeimbangkannya dengan visual, dan bisa mematikan fitur audio jika Anda ingin menambah musik atau voiceover sendiri nanti.
Untuk kreator yang peduli tentang bahasa kamera, LTX-2.3 22B menghadirkan kontrol pergerakan kamera khusus yang lebih dari sekadar deskripsi di prompt. Anda bisa memilih gerak spesifik seperti dolly in, dolly out, dolly kiri, dolly kanan, jib naik, jib turun, atau shot statis — dan mengatur seberapa kuat gerakan tersebut diterapkan. Ini memberi Anda kendali konsisten dan bisa diulang atas perilaku kamera, sangat membantu untuk mencocokkan shot, membangun urutan, atau mendapatkan nuansa sinematik tertentu.
Model ini juga menawarkan pendekatan multi-skala sebagai default. Dengan ini, model terlebih dahulu membuat versi video kecil lalu menggunakannya untuk memandu render akhir yang lebih besar dan halus. Hasilnya adalah koherensi yang lebih baik dan detail lebih kaya pada klip akhir Anda. Kontrol refinement tambahan memungkinkan Anda mengatur seberapa ketat hasil mengikuti prompt, fokus dan konsistensi konten, serta tingkat detail render secara keseluruhan. Ada juga opsi peningkatan sampling untuk variasi halus demi kualitas yang lebih baik.
Opsi akselerasi memungkinkan Anda memilih keseimbangan antara kecepatan dan kualitas, mulai dari tanpa akselerasi hingga akselerasi penuh, sehingga Anda bisa memilih prioritas antara fidelitas maksimal atau proses yang lebih cepat. Anda juga dapat menentukan tingkat kualitas output — dari rendah hingga maksimal — dan memilih cara file akhir diekspor, dengan pilihan dipercepat, hasil seimbang, atau ukuran file lebih kecil.
Saat mendistribusikan hasil akhir, LTX-2.3 22B mendukung beragam format output sesuai kebutuhan workflow. Anda bisa ekspor video standar MP4, WebM, ProRes berkualitas tinggi untuk pipeline editing profesional, atau animated GIF untuk berbagi ringan. Fleksibilitas ini membuat model cocok digunakan langsung di postingan sosial maupun di proses editing profesional.
Untuk menghindari hasil yang tidak diinginkan, model menggunakan negative prompt secara default untuk menolak elemen seperti gaya berita, animasi 3D, estetika game dan kartun, watermark, teks di layar, subtitle, serta klip terlalu statis atau lambat. Default ini membantu memastikan hasil lebih alami, sinematik, dan live-action. Anda bisa menyesuaikan panduan ini sesuai arah kreatif sendiri. Safety checker juga diaktifkan secara default untuk menjaga konten tetap sesuai. Untuk konsistensi, Anda dapat mengatur seed value agar bisa mereplikasi atau mengembangkan hasil tertentu.
LTX-2.3 22B paling cocok untuk kreator yang ingin cara ringkas dan sederhana membuat video sinematik pendek dengan suara — film konsep, video mood, shot iklan, visual musik, animatic, konten sosial, dan eksperimen naratif. Karena responsnya sangat baik terhadap prompt detail dan sugestif, menulis prompt yang menggambarkan pencahayaan, suasana, pergerakan kamera, dan perilaku subjek akan selalu menghasilkan footage yang lebih kuat dan terarah. Dengan gabungan generasi audiovisual, format fleksibel, ekspor profesional, serta kontrol kamera dan refinement presisi, model ini menawarkan toolkit serbaguna untuk mewujudkan adegan imajinasi ke layar.
A woman kneeling in darkness, illuminated by a warm, radiant beam of light emerging from her raised hand.
Jelaskan adegan video Anda beserta gerakan, sudut kamera, dan suasana
Model menciptakan gerakan sinematik dengan fisika dan pencahayaan alami
Unduh dan bagikan video siap produksi Anda
Overhead shot of a sizzling cast iron skillet on gas flame. Fresh vegetables being tossed into the pan creating steam burst. Chef's hands flip ingredients with professional technique. Oil splatters catch the light. Flames briefly flare up. Aromatic herbs sprinkled from above floating down in slow motion. Camera slowly zooms in on the cooking action. Warm kitchen lighting, steam rising. 6 seconds, dynamic motion, appetizing colors.
Tracking shot through a rain-soaked city street at night. Neon signs in Japanese and English reflect in puddles and wet pavement. Camera moves forward at walking pace, passing pedestrians with umbrellas. Steam rises from street vents. Raindrops fall through colorful light beams. Shop windows glow with warm light. Occasional car passes creating light trails. Cyberpunk aesthetic, rich saturated colors. 8 seconds, smooth forward tracking, cinematic atmosphere.
Slow motion fashion video of model walking toward camera on minimalist runway. Dramatic side lighting creates strong shadows on flowing fabric. Hair and dress move elegantly with each step. Camera dollies backward maintaining distance as model approaches. Fabric ripples and catches light. Confident, powerful stride. Shallow depth of field with clean background. Gradual zoom to face reveal. 6 seconds, 60fps slow motion, high fashion aesthetic.
“Cinematic reveal of a sleek black luxury sports car in a dark studio. Camera starts close on the chrome badge, slowly pulling back while orbiting 180 degrees around the vehicle. Dramatic rim lighting gradually intensifies, highlighting the car's sculptural curves and glossy finish. Reflections dance across the body as the camera moves. Dust particles float in volumetric light beams. Final wide shot reveals the full silhouette against a gradient backdrop. 8 seconds, smooth motion, 24fps cinematic quality.”
Beralih ke sintesis berbasis penalaran hari ini

Cinematic video with native audio
1.4 kredit

Multi-shot cinematic text-to-video
4 kredit

Cinematic video from references
10 kredit

Fast balanced text-to-video generation
1.6 kredit

Fast cinematic video with audio
0.1 kredit

Cinematic video from references
0.4 kredit

Film-grade video with audio
0.1 kredit