1M AI Newsのモニタリングによると、AlibabaのTongyi実験室が画像生成・編集の統一モデル「Wan2.7-Image」を発表し、「より本物に、人より文字が安定し、色がより正確に」を売りにしています。
モデルは、Hex Color Codeを直接入力してパレットを定義でき、公式のまとめページでは8種類のHexcodeを用いた色制御が可能だとされています。文字レンダリング側は、英語の出力が4000文字対応しているほか、中国語簡体字、中国語繁体字、英語、日本語、韓国語などの多言語にも対応し、表や数式を混在させたレイアウトにも対応しています。
連続制作は今回のアップデートのもう一つの重点です。Wan2.7-Imageは最大12枚の組み合わせ画像の生成に対応し、最大9枚の参照画像の入力も可能で、絵コンテ、シリーズのポスター、キャラクターの一貫性の生成に利用できます。編集側では、精密な枠選択による編集と、完全な透明チャネルでのPNG生成が追加され、枠選択した要素と背景を分離できます。公式が挙げた導入シーンには、ECの掲載画像、短編ドラマの絵コンテ、教育用の図表、児童向けの絵本、ポスター、招待状のデザインなどが含まれます。公式サイトとAPIはすでに公開されています。