通义千问Qwen-Image-Edit发布:兼具语义与外观双重编辑能力

2025年08月19日,06时27分57秒 科技新知 阅读 31 views 次

凤凰网科技讯 8月19日,通义千问Qwen宣布推出Qwen-Image-Edit,Qwen-Image的图像编辑版本。

Qwen-Image-Edit基于20B的Qwen-Image模型进⼀步训练,成功将Qwen-Image的独特的文本渲染能力延展至图像编辑领域,实现了对图片中文字的精准编辑。

此外,Qwen-Image-Edit将输⼊图像同时输⼊到Qwen2.5-VL(实现视觉语义控制)和 VAE Encoder(实现视觉外观控制),从而兼具语义与外观的双重编辑能力。

通义千问Qwen-Image-Edit发布:兼具语义与外观双重编辑能力

通义千问Qwen-Image-Edit发布:兼具语义与外观双重编辑能力

通义千问Qwen-Image-Edit发布:兼具语义与外观双重编辑能力

(来源:新浪科技)

标签:


用户登录