Flexible multilingual image generation model















Wan v2.6 Text to Image adalah alat kreatif yang sangat serbaguna yang dikembangkan oleh Black Forest Labs, dirancang untuk memberdayakan seniman, desainer, pembuat film, dan pembuat konten dengan kemampuan generasi teks-ke-gambar dan media campuran tingkat lanjut. Model ini memungkinkan pengguna mengubah deskripsi tertulis menjadi gambar yang hidup dan berkualitas tinggi, menjadikannya aset kuat untuk mewujudkan visi kreatif dalam berbagai bidang, mulai dari seni konsep dan storyboard hingga mockup desain dan pembuatan moodboard.
Pada intinya, model ini unggul dalam mengambil prompt teks terperinci—mendukung bahasa Cina dan Inggris—dan menginterpretasikannya menjadi gambar kustom yang menangkap esensi dan suasana yang dijelaskan pengguna. Baik membayangkan adegan fotorealistik, dunia fantasi imajinatif, atau snapshot spesifik dari sebuah cerita, Wan v2.6 berfungsi sebagai kanvas digital untuk imajinasi tekstual.
Salah satu fitur unggulan model ini adalah fleksibilitas inputnya. Pengguna dapat membimbing proses generasi gambar tidak hanya dengan teks tetapi juga dengan mengunggah gambar referensi. Ini memungkinkan pembuatan yang dipandu gaya, di mana Anda dapat mencampur visi prompt dengan suasana, warna, atau komposisi gambar yang ada. Ini sangat berharga bagi profesional yang mencari konsistensi aset visual atau menyesuaikan prompt dengan gaya referensi spesifik.
Untuk kustomisasi output, Wan v2.6 menawarkan berbagai kontrol kreatif untuk menyesuaikan hasil dengan kebutuhan proyek Anda. Anda dapat memilih dari berbagai rasio aspek gambar preset—seperti persegi, potret (4:3 atau 16:9), dan lanskap (4:3 atau 16:9)—memudahkan penyesuaian output dengan format media sosial, film, atau presentasi standar. Pengguna lanjutan dapat menentukan dimensi gambar tepat, dalam rentang yang didukung, memungkinkan output resolusi tinggi hingga ukuran piksel signifikan. Ini memastikan gambar yang dihasilkan cocok untuk pekerjaan desain rinci, presentasi profesional, atau cetak skala besar.
Model ini memungkinkan Anda menghasilkan beberapa gambar per prompt (hingga lima sekaligus), memberi kemampuan mengeksplorasi interpretasi visual berbeda dengan cepat. Profesional kreatif juga dapat menggunakan fitur "content to avoid"—cara sederhana menyaring elemen tidak diinginkan dari hasil, seperti kualitas rendah, distorsi, atau detail tidak diinginkan spesifik. Ini memberdayakan pengguna menyempurnakan arah kreatif dan mengurangi kejutan tidak diinginkan dalam output.
Bagi yang mencari hasil dapat diulang (penting dalam proyek kolaboratif atau iteratif), model ini mendukung pemilihan nomor seed acak. Ini berarti Anda dapat meregenerasi variasi gambar sebelumnya dengan andal hanya dengan menggunakan seed dan input sama, memungkinkan arah seni konsisten dan siklus revisi mudah.
Wan v2.6 dibangun dengan mempertimbangkan keselamatan dan generasi konten bertanggung jawab. Fitur moderasi konten tersedia, yang menyaring input dan output untuk kepatuhan dan kesesuaian. Ini membantu memastikan lingkungan kreatif profesional dan hormat bagi pengguna proyek publik atau komersial.
Input dan output model mendukung berbagai format gambar untuk referensi dan unduhan, termasuk JPEG, JPG, PNG (tanpa saluran alpha), BMP, dan WEBP, dengan resolusi gambar input dari 384 hingga 5000 piksel. Format output berbasis gambar, cocok untuk penggunaan segera dalam proyek digital, presentasi, dan desain cetak, serta pengeditan lebih lanjut di alat pilihan Anda.
Meskipun Wan v2.6 menyediakan berbagai opsi kreatif, output secara alami dipengaruhi oleh detail dan kejelasan prompt Anda. Prompt lebih spesifik biasanya menghasilkan hasil lebih tepat. Panjang prompt maksimum 2000 karakter, dan Anda dapat menyertakan negative prompt hingga 500 karakter untuk kontrol kreatif lebih lanjut.
Secara ringkas, Wan v2.6 Text to Image menonjol sebagai mesin kuat dan ramah pengguna untuk bercerita visual, prototipe, dan eksplorasi artistik. Ini beradaptasi dengan alur kerja berbagai profesi kreatif—menyederhanakan generasi visual kustom dan menawarkan fleksibilitas untuk memicu inspirasi serta mewujudkan konsep artistik kompleks dengan cepat dan andal.
A woman kneeling in darkness, illuminated by a warm, radiant beam of light emerging from her raised hand.
Ketik prompt yang menggambarkan gambar yang diinginkan dengan detail gaya, pencahayaan, dan komposisi
Model memahami fisika, pencahayaan, dan niat emosional adegan Anda
Klik untuk menghasilkan output akhir dan unduh gambar berkualitas produksi
Memamerkan kemampuan model menciptakan visual sinematik sudut lebar dengan pencahayaan atmosferik dan tampilan filmik trendy, sempurna untuk bercerita.

Mengilustrasikan generasi adegan hidup aspirasional dengan multiple orang, gender dan styling presisi—ideal untuk branding lifestyle modern.

Menyoroti bagaimana model merender kompleksitas arsitektur, cahaya atmosferik, dan detail fotorealistik—meningkatkan bercerita visual modern aspirasional.

“High-end studio product photography of premium wireless over-ear headphones in matte black finish. Dramatic three-point lighting with soft key light from upper left, rim light highlighting the ear cup contours, and subtle fill. Clean white seamless backdrop with soft gradient. Sharp focus on texture details of the leather headband and brushed metal accents. Professional advertising quality, 8K resolution, photorealistic rendering.”

Beralih ke sintesis berpandu penalaran hari ini

Advanced text-to-image generation
0.2 kredit
![FLUX.2 [klein] 4B LoRA](https://v3b.fal.media/files/b/0a928da0/57Gi1qonPRBT6XhWAvMAH_ac391991cfe0414199ae74f054947eef.jpg)
Ultra-realistic images, advanced editing
0.3 kredit

Transparent background image generation
0.2 kredit

Precise structured text-to-image generation
0.2 kredit

Fast, state-of-the-art image generation
0.8 kredit

Seamless photorealistic textures from text
0.8 kredit

Seamless photorealistic tiling from text
0.3 kredit

Unified image generation and editing
0.3 kredit

Ultra-fast advanced image generation
0.7 kredit