Text to video with audio
LTX-2.3 22B is een krachtig tekst-naar-video-model dat geschreven beschrijvingen omzet in volledig uitgewerkte videoclips — compleet met gesynchroniseerd geluid. Beschrijf simpelweg de scène die je voor je ziet, en het model brengt deze tot leven als bewegend beeld, waarbij zowel de visuals als een bijpassende soundtrack in één keer worden gegenereerd. Dit maakt het een ideale creatieve partner voor filmmakers, motion designers, adverteerders, makers van sociale content en visuele verhalenvertellers die van idee naar afgewerkte clip willen gaan zonder losse tools voor beeld en geluid te gebruiken.
De kern van het model is het vermogen om rijke, filmische prompts te interpreteren. Een beschrijving als "Een cowboy loopt door een stoffige stad op het heetst van de dag, camera volgt van achteren, filmische diepte, realistische belichting, westernsfeer, 4K filmkorrel" geeft het model alles wat het nodig heeft om een samenhangende, sfeervolle shot te componeren. Hoe uitgebreider en doelgerichter je prompt — met details als sfeer, licht, camerabeweging en visuele stijl — hoe beter het resultaat aansluit bij je visie. Een ingebouwde promptuitbreidingsfunctie kan automatisch je beschrijvingen verrijken, zodat korte prompts toch meer gedetailleerde en gepolijste resultaten opleveren.
Met LTX-2.3 22B heb je veel controle over de lengte en vorm van je video's. Je kunt alles genereren van zeer korte clips van een paar frames tot lange sequenties van enkele honderden frames, waardoor je alles kunt maken van korte loops en social snippets tot uitgebreide verhalende shots. De framerate is volledig instelbaar, zodat je kunt kiezen voor vloeiende, filmische beweging of een meer gestileerde timing, afhankelijk van je project. De standaardinstelling maakt een clip van 121 frames op 24 frames per seconde — een natuurlijke, filmische cadans. Je kunt ook de beeldverhouding kiezen, waarbij het breedbeeld 16:9 landschap standaard staat ingesteld. Dit maakt het gemakkelijk om beelden te produceren die geschikt zijn voor film, web en sociale platforms.
Een van de opvallende kenmerken is geïntegreerde audiogeneratie. Standaard krijgt elke video een eigen soundtrack die speciaal voor de scène wordt gecreëerd, zodat het geluid past bij het beeld en niet achteraf hoeft te worden toegevoegd. Je hebt aparte creatieve controle over hoe het geluid wordt vormgegeven en je kunt balanceren hoeveel nadruk het model legt op beeld of geluid. Wil je liever stil beeld om later eigen muziek of voice-over toe te voegen? Dan kun je audiogeneratie eenvoudig uitschakelen.
Voor makers die let op cameralogica bevat LTX-2.3 22B speciale camerabewegingsopties die verder gaan dan alleen prompten. Je kunt kiezen voor specifieke bewegingen zoals dolly in, dolly uit, dolly links, dolly rechts, jib omhoog, jib omlaag, of een vaste statische shot — en instellen hoe sterk deze beweging wordt toegepast. Hiermee krijg je betrouwbare, herhaalbare controle over het cameragedrag — onmisbaar om shots te laten matchen, series op te bouwen, of een specifieke filmische sfeer te bereiken.
Het model biedt daarnaast standaard een multi-scale generatiebenadering. Hierbij wordt eerst een kleinere versie van de video gemaakt, die vervolgens wordt gebruikt om een grotere, verfijnde eindversie te sturen. Het resultaat is betere samenhang en rijkere details in je uiteindelijke clip. Extra verfijningsopties laten je instellen hoe nauw het resultaat je prompt volgt, hoe scherp en consistent de inhoud blijft, en het detailniveau van de render. Er is ook een optionele samplingverbetering die subtiele variatie tijdens het genereren toevoegt voor hogere kwaliteit.
Versnellingsopties laten je kiezen hoe het model snelheid en kwaliteit balanceert, van geen versnelling tot volledige acceleratie. Zo kun je kiezen voor maximale getrouwheid of snellere resultaten. Ook kun je het gewenste kwaliteitsniveau instellen — van laag tot maximaal — en bepalen op welke manier het eindbestand wordt weggeschreven, met opties voor snelle verwerking, uitgebalanceerde resultaten of kleinere bestandsgroottes.
Bij het leveren van je eindresultaat ondersteunt LTX-2.3 22B verschillende uitvoerformaten voor uiteenlopende workflows. Je kunt exporteren als standaard MP4-video, WebM, hoogwaardige ProRes voor professionele montages, of geanimeerde GIFs voor lichtgewicht delen. Dankzij deze flexibiliteit kun je het model zowel gebruiken voor snelle sociale posts als voor professionele montageprojecten.
Om ongewenste stijlen te vermijden, gebruikt het model standaard een negatieve prompt die elementen zoals nieuws-graphics, 3D-animatie, videogame- en cartoon-uitstraling, watermerken, in-beeld-tekst, ondertitels en te statische of slow-motion beelden ontmoedigt. Dit helpt om het resultaat richting natuurlijk, filmisch live-actionbeeld te sturen. Je kunt deze begeleiding naar eigen wens aanpassen. Ook is er standaard een safety checker actief om ervoor te zorgen dat de beelden passend blijven. Voor consistentie kun je een seed instellen, zodat je een bepaald resultaat kunt reproduceren of verder itereren.
LTX-2.3 22B is ideaal voor makers die op één gestroomlijnde manier korte filmische video's met geluid willen produceren — conceptfilms, sfeerbeelden, reclameclips, muziekgedreven visuals, animatics, social content en experimentele verhalen. Omdat het model zo goed reageert op rijke, beeldende prompts beloont het doordacht schrijven: belichting, sfeer, camerabeweging en gedrag van het onderwerp beschrijven levert steevast overtuigender beeld op. Met zijn combinatie van beeld- en audiogeneratie, flexibele formaten, professionele exportkeuzes, en precieze camera- en verfijningscontrole krijg je een veelzijdige toolkit om je verbeelde scène op het scherm te brengen.
A woman kneeling in darkness, illuminated by a warm, radiant beam of light emerging from her raised hand.
Beschrijf je videoscène met beweging, camerahoeken en sfeer
Het model creëert cinematische beweging met natuurlijke fysica en belichting
Download en deel je productieklare video
Overhead shot of a sizzling cast iron skillet on gas flame. Fresh vegetables being tossed into the pan creating steam burst. Chef's hands flip ingredients with professional technique. Oil splatters catch the light. Flames briefly flare up. Aromatic herbs sprinkled from above floating down in slow motion. Camera slowly zooms in on the cooking action. Warm kitchen lighting, steam rising. 6 seconds, dynamic motion, appetizing colors.
Tracking shot through a rain-soaked city street at night. Neon signs in Japanese and English reflect in puddles and wet pavement. Camera moves forward at walking pace, passing pedestrians with umbrellas. Steam rises from street vents. Raindrops fall through colorful light beams. Shop windows glow with warm light. Occasional car passes creating light trails. Cyberpunk aesthetic, rich saturated colors. 8 seconds, smooth forward tracking, cinematic atmosphere.
Slow motion fashion video of model walking toward camera on minimalist runway. Dramatic side lighting creates strong shadows on flowing fabric. Hair and dress move elegantly with each step. Camera dollies backward maintaining distance as model approaches. Fabric ripples and catches light. Confident, powerful stride. Shallow depth of field with clean background. Gradual zoom to face reveal. 6 seconds, 60fps slow motion, high fashion aesthetic.
“Cinematic reveal of a sleek black luxury sports car in a dark studio. Camera starts close on the chrome badge, slowly pulling back while orbiting 180 degrees around the vehicle. Dramatic rim lighting gradually intensifies, highlighting the car's sculptural curves and glossy finish. Reflections dance across the body as the camera moves. Dust particles float in volumetric light beams. Final wide shot reveals the full silhouette against a gradient backdrop. 8 seconds, smooth motion, 24fps cinematic quality.”
Schakel vandaag over op reasoning-gestuurde synthese

Multi-shot cinematic text-to-video
4 credits

Cinematic video from references
0.4 credits

Fast balanced text-to-video generation
1.6 credits

Film-grade video with audio
0.1 credits

Cinematic video from references
10 credits

Cinematic video with native audio
1.4 credits

Fast cinematic video with audio
0.1 credits