Laut dem Monitoring von 1M AI News hat das Alibaba Tongyi-Labor das einheitliche Modell für Bildgenerierung und -bearbeitung Wan2.7-Image veröffentlicht. Es steht im Fokus auf „Menschen wirken echter, Buchstaben sind stabiler, Farben sind präziser“.
Das Modell unterstützt die direkte Eingabe von Hex Color Code zur Definition einer Farbpalette; die offizielle Zusammenfassungsseite nennt, dass es zum Steuern mit 8 Hexcodes eingesetzt werden kann. Für das Text-Rendering unterstützt es die Ausgabe von 4000 englischen Zeichen und auch mehrere Sprachen wie vereinfachtes Chinesisch, traditionelles Chinesisch, Englisch, Japanisch, Koreanisch sowie die Mischformatierung mit Tabellen und mathematischen Formeln.
Kontinuierliches Creative ist ein weiterer Schwerpunkt des Updates. Wan2.7-Image unterstützt die Generierung von bis zu 12 Bildern in einem Set sowie die Eingabe von bis zu 9 Referenzbildern. Es kann für Storyboards, Serienposter und die Generierung mit konsistenter Charakterdarstellung genutzt werden. Auf der Bearbeitungsseite wurden präzises Rechteck-Auswahl-Editieren und die Erzeugung von vollständig transparenten PNGs hinzugefügt, sodass die ausgewählten Elemente vom Hintergrund getrennt werden können. Zu den von der offiziellen Seite genannten Einsatzszenarien gehören Produktbilder für den E-Commerce, Storyboard-Bilder für Kurzdramen, Bildungsdiagramme, Bilderbücher für Kinder, Poster- und Einladungskartendesigns. Die Website und die API sind bereits online.