Flexible multilingual image generation model















Wan v2.6 Text to Image est un outil créatif hautement polyvalent développé par Black Forest Labs, conçu pour permettre aux artistes, designers, cinéastes et créateurs de contenu de bénéficier de capacités avancées de génération d'images à partir de texte et de médias mixtes. Ce modèle permet aux utilisateurs de transformer des descriptions écrites en images vives et de haute qualité, en faisant un atout puissant pour concrétiser les visions créatives dans de nombreux domaines, de l'art conceptuel et du storyboarding aux maquettes de design et à la création de moodboards.
Au cœur du modèle, il excelle dans la prise en charge de prompts textuels détaillés — supportant à la fois le chinois et l'anglais — et leur interprétation en images personnalisées qui capturent l'essence et l'atmosphère décrites par l'utilisateur. Que ce soit pour imaginer une scène photoréaliste, un monde fantastique imaginaire ou un instantané spécifique d'une histoire, Wan v2.6 sert de toile numérique pour l'imagination textuelle.
L'une des fonctionnalités phares du modèle est sa flexibilité en entrée. Les utilisateurs peuvent guider le processus de génération d'images non seulement avec du texte, mais aussi en téléchargeant une image de référence. Cela permet une création guidée par le style, où vous pouvez mélanger la vision de votre prompt avec l'ambiance, les couleurs ou la composition d'une image existante. Cela est particulièrement précieux pour les professionnels cherchant une cohérence dans leurs actifs visuels ou visant à adapter des prompts à un style de référence spécifique.
En termes de personnalisation de sortie, Wan v2.6 offre divers contrôles créatifs pour adapter les résultats aux besoins de votre projet. Vous pouvez sélectionner parmi une variété de ratios d'aspect prédéfinis — tels que carré, portrait (4:3 ou 16:9) et paysage (4:3 ou 16:9) — facilitant l'adaptation des sorties aux formats standards des réseaux sociaux, du cinéma ou des présentations. Les utilisateurs avancés peuvent spécifier des dimensions d'image exactes, dans la plage supportée, permettant des sorties en haute résolution jusqu'à des tailles de pixels significatives. Cela garantit que les images générées conviennent à un travail de design détaillé, des présentations professionnelles ou des impressions à grande échelle.
Le modèle vous permet de générer plusieurs images par prompt (jusqu'à cinq à la fois), vous offrant la possibilité d'explorer rapidement différentes interprétations visuelles. Les professionnels créatifs peuvent également utiliser la fonctionnalité « contenu à éviter » — une façon simple de filtrer les éléments indésirables du résultat, tels que faible qualité, distorsions ou détails spécifiques non souhaités. Cela permet aux utilisateurs d'affiner leur direction créative et de réduire les surprises indésirables dans la sortie.
Pour ceux cherchant des résultats reproductibles (important dans les projets collaboratifs ou itératifs), le modèle prend en charge le choix d'un numéro de seed aléatoire. Cela signifie que vous pouvez régénérer de manière fiable une variation d'image précédente simplement en réutilisant le même seed et les mêmes entrées, permettant une direction artistique cohérente et des cycles de révision faciles.
Wan v2.6 est conçu avec la sécurité et la génération de contenu responsable à l'esprit. Une fonctionnalité de modération de contenu est disponible, qui filtre les entrées et sorties pour assurer la conformité et l'adéquation. Cela contribue à garantir un environnement créatif professionnel et respectueux pour les utilisateurs travaillant sur des projets publics ou commerciaux.
Les entrées et sorties du modèle supportent une variété de formats d'image pour la référence et le téléchargement, incluant JPEG, JPG, PNG (sans canal alpha), BMP et WEBP, avec des résolutions d'images d'entrée allant de 384 à 5000 pixels. Le format de sortie est basé sur l'image, adapté à une utilisation immédiate dans des projets numériques, présentations et design d'impression, ainsi qu'à un édition ultérieure dans vos outils préférés.
Bien que Wan v2.6 offre une large gamme d'options créatives, les sorties sont naturellement influencées par le détail et la clarté de vos prompts. Des prompts plus spécifiques mènent généralement à des résultats plus précis. La longueur maximale du prompt est de 2000 caractères, et vous pouvez inclure des prompts négatifs jusqu'à 500 caractères pour un contrôle créatif supplémentaire.
En résumé, Wan v2.6 Text to Image se distingue comme un moteur robuste et convivial pour le storytelling visuel, le prototypage et l'exploration artistique. Il s'adapte aux workflows de différentes professions créatives — en rationalisant la génération de visuels personnalisés et en offrant la flexibilité nécessaire pour alimenter l'inspiration et réaliser rapidement et de manière fiable des concepts artistiques complexes.
A woman kneeling in darkness, illuminated by a warm, radiant beam of light emerging from her raised hand.
Tapez une invite décrivant l'image souhaitée avec des détails sur le style, l'éclairage et la composition
Le modèle comprend la physique, l'éclairage et l'intention émotionnelle de votre scène
Cliquez pour générer votre sortie finale et télécharger l'image de qualité production
Montre la capacité du modèle à créer des visuels cinématographiques en grand-angle avec un éclairage atmosphérique et un look filmique tendance, parfait pour le storytelling.

Illustre la génération de scènes dynamiques et aspirationnelles mettant en scène plusieurs personnes avec un genre et un stylisme précis — idéal pour le branding lifestyle moderne.

Met en valeur la manière dont le modèle rend la complexité architecturale, la lumière atmosphérique et les détails photoréalistes — enrichissant le storytelling visuel moderne et aspirationnel.

“High-end studio product photography of premium wireless over-ear headphones in matte black finish. Dramatic three-point lighting with soft key light from upper left, rim light highlighting the ear cup contours, and subtle fill. Clean white seamless backdrop with soft gradient. Sharp focus on texture details of the leather headband and brushed metal accents. Professional advertising quality, 8K resolution, photorealistic rendering.”

Passez à la synthèse guidée par le raisonnement dès aujourd'hui

Seamless photorealistic tiling from text
0.3 crédits

Premium pro text-to-image generation
0.3 crédits

Transparent background image generation
0.2 crédits

Fast, state-of-the-art image generation
0.8 crédits

Precise structured text-to-image generation
0.2 crédits

Advanced text-to-image generation
0.2 crédits

Ultra-fast advanced image generation
0.7 crédits

Personalized photo generation from text
0.4 crédits

Unified text-to-image generation
0.6 crédits