Text to video with audio
LTX-2.3 22B er en kraftig tekst-til-video-modell som forvandler skrevne beskrivelser til fullverdige videoklipp – komplett med synkronisert lyd. Bare beskriv scenen du ser for deg, så bringer modellen den til live som bevegende bilder, og genererer både visuelle elementer og et matchende lydspor i én og samme omgang. Dette gjør den til en ideell kreativ partner for filmskapere, motion designere, annonsører, skapere av sosiale medier-innhold, og visuelle historiefortellere som vil gå fra idé til ferdig klipp uten å måtte bruke separate verktøy for bilde og lyd.
Kjernen i modellen er dens evne til å tolke rike, filmatiske prompt. En beskrivelse som "En cowboy som går gjennom en støvete by ved høylys dag, kamera følger bakfra, filmatisk dybde, realistisk lyssetting, western-stemning, 4K film grain" gir modellen alt den trenger for å komponere et sammenhengende, stemningsfullt opptak. Jo mer beskrivende og gjennomtenkt prompten din er – med tanke på stemning, lys, kameraføring og visuell stil – jo tettere vil resultatet matche din visjon. En innebygd prompt-utvidelse kan automatisk berike beskrivelsene dine, slik at også korte prompts gir mer detaljerte og polerte resultater.
LTX-2.3 22B gir deg meningsfull kontroll over lengde og format på videoene dine. Du kan generere alt fra veldig korte klipp på bare noen få bilder til lange sekvenser på flere hundre bilder, slik at du kan lage alt fra raske looper og korte sosiale klipp til utvidede fortellersekvenser. Bildetakt (frame rate) er også helt justerbar, slik at du kan velge mellom jevn, filmatisk bevegelse eller mer stilisert timing etter behov. Standardinnstillingen produserer et klipp på 121 bilder ved 24 bilder per sekund – en naturlig, filmlignende rytme. Du kan også velge sideforhold, med widescreen 16:9 landskapsformat som standard, noe som gjør det enkelt å lage klipp som passer til film, nett og sosiale plattformer.
En av modellens fremtredende funksjoner er integrert lydgenerering. Som standard får hvert videoklipp sitt eget genererte lydspor, slik at lyden er laget for å passe til scenen og ikke blir lagt på i etterkant. Du har egne kreative kontroller for hvordan lyden formes, og du kan balansere hvor mye modellen vektlegger det visuelle versus lyden. Hvis du foretrekker klipp uten lyd til prosjekter der du vil legge til egen musikk eller stemme senere, kan lydgenerering enkelt slås av.
For skapere som er opptatt av kamerabevegelser, har LTX-2.3 22B dedikerte kontroller som gir deg mer enn det promptene alene klarer. Du kan velge spesifikke bevegelser som dolly inn, dolly ut, dolly venstre, dolly høyre, jib opp, jib ned, eller låst statisk kamera – og justere hvor sterkt denne bevegelsen påvirker opptaket. Dette gir deg pålitelig, repeterbar kontroll over kameraføringen, som er uvurderlig for å matche klipp, bygge sekvenser eller oppnå en bestemt filmatisk følelse.
Modellen tilbyr også en flerskala-genereringsprosess, som er aktivert som standard. Her vil modellen først lage en mindre versjon av videoen, og bruke denne til å styre en større og mer raffinert sluttversjon. Resultatet er bedre sammenheng og rikere detaljer i det ferdige klippet ditt. Ekstra finjusteringskontroller lar deg styre hvor tett resultatet følger prompten din, hvor fokusert og konsistent innholdet er, og detaljeringsnivået på gjengivelsen. Det finnes også et valgfritt sampling-forbedringstrinn som gir subtile variasjoner i genereringen for bedre kvalitet.
Akselerasjonsalternativer lar deg styre hvordan modellen balanserer hastighet og kvalitet, fra ingen akselerasjon til full akselerasjon, slik at du kan prioritere enten maksimalt detaljnivå eller raskere levering. Du kan også bestemme kvalitetsnivået på utdata – fra lav til maksimal – og velge hvordan filen skal skrives ut, med alternativer som vektlegger rask behandling, balanserte resultater eller mindre filstørrelser.
Når det gjelder levering av ditt ferdige arbeid, støtter LTX-2.3 22B flere utdataformater for ulike arbeidsflyter. Du kan eksportere som standard MP4-video, WebM, høyoppløselig ProRes for profesjonelle redigeringsmiljø, eller animerte GIF-filer for enkel deling. Denne fleksibiliteten gjør at modellen passer like godt enten du vil legge inn et klipp direkte i sosiale medier eller ta det videre til profesjonell videoredigering.
For å styre unna uønskede uttrykk bruker modellen et negativt prompt som standard, som fraråder elementer som nyhetsgrafikk, 3D-animasjon, spill- eller tegneserieestetikk, vannmerker, tekst på skjerm, undertekster, samt for statiske eller saktegående klipp. Dette hjelper output på vei mot naturlige, filmatiske live action-resultater. Du kan justere denne styringen etter din egen kreative retning. En sikkerhetskontroll er også aktivert som standard for å bidra til at innholdet holder seg passende. For konsistens kan du sette en seed-verdi, som lar deg reprodusere eller iterere på et bestemt resultat.
LTX-2.3 22B passer best for skapere som ønsker en enkel og effektiv måte å lage korte, filmatiske videoer med lyd på – konseptfilmer, stemningsklipp, reklameopptak, musikkdrevne visuelle, animatics, sosiale medier-innhold og narrative eksperimenter. Fordi modellen reagerer så godt på detaljerte, stemningsfulle beskrivelser, lønner det seg å bruke tid på prompten: Beskriv belysning, atmosfære, kamerabevegelse og objekters oppførsel for å få sterkere og mer målrettede resultater. Med sin kombinasjon av lyd- og videoproduksjon, fleksible formater, profesjonelle eksportmuligheter og presise kamera- og finjusteringskontroller tilbyr den et allsidig verktøysett for å bringe tenkte scener ut på skjermen.
A woman kneeling in darkness, illuminated by a warm, radiant beam of light emerging from her raised hand.
Beskriv videoscenen din med bevegelse, kameravinkler og stemning
Modellen skaper filmatisk bevegelse med naturlig fysikk og lyssetting
Last ned og del den produksjonsklare videoen din
Overhead shot of a sizzling cast iron skillet on gas flame. Fresh vegetables being tossed into the pan creating steam burst. Chef's hands flip ingredients with professional technique. Oil splatters catch the light. Flames briefly flare up. Aromatic herbs sprinkled from above floating down in slow motion. Camera slowly zooms in on the cooking action. Warm kitchen lighting, steam rising. 6 seconds, dynamic motion, appetizing colors.
Tracking shot through a rain-soaked city street at night. Neon signs in Japanese and English reflect in puddles and wet pavement. Camera moves forward at walking pace, passing pedestrians with umbrellas. Steam rises from street vents. Raindrops fall through colorful light beams. Shop windows glow with warm light. Occasional car passes creating light trails. Cyberpunk aesthetic, rich saturated colors. 8 seconds, smooth forward tracking, cinematic atmosphere.
Slow motion fashion video of model walking toward camera on minimalist runway. Dramatic side lighting creates strong shadows on flowing fabric. Hair and dress move elegantly with each step. Camera dollies backward maintaining distance as model approaches. Fabric ripples and catches light. Confident, powerful stride. Shallow depth of field with clean background. Gradual zoom to face reveal. 6 seconds, 60fps slow motion, high fashion aesthetic.
“Cinematic reveal of a sleek black luxury sports car in a dark studio. Camera starts close on the chrome badge, slowly pulling back while orbiting 180 degrees around the vehicle. Dramatic rim lighting gradually intensifies, highlighting the car's sculptural curves and glossy finish. Reflections dance across the body as the camera moves. Dust particles float in volumetric light beams. Final wide shot reveals the full silhouette against a gradient backdrop. 8 seconds, smooth motion, 24fps cinematic quality.”
Bytt til resonneringsstyrt syntese i dag

Fast balanced text-to-video generation
1.6 kreditter

Cinematic video from references
10 kreditter

Film-grade video with audio
0.1 kreditter

Fast cinematic video with audio
0.1 kreditter

Multi-shot cinematic text-to-video
4 kreditter

Cinematic video with native audio
1.4 kreditter

Cinematic video from references
0.4 kreditter