谷歌发布图像生成模型Gemini 2.5 Flash Image：多方面优于GPT-4o

2025年08月27日,10时26分35秒科技新知阅读 26 views 次

凤凰网科技讯 8月27日，科技媒体The Decoder昨日（8月26日）发布博文，报道称谷歌DeepMind正式推出其最先进的图像生成与编辑模型Gemini 2.5 Flash Image，在Gemini应用中可根据文字指令，在保持人物与动物的外观一致的情况下，提高修改图片的精度。

据介绍，与此前的原生图像生成工具相比，它在根据文字进行图像修改时的准确率更高，谷歌表示，Gemini 2.5 Flash Image在多项任务中优于ChatGPT所用的GPT-4o，特别是在编辑图像时，它可以根据文字提示进行编辑。

谷歌发布图像生成模型Gemini 2.5 Flash Image：多方面优于GPT-4o

该模型还支持通过文本提示进行精确的局部编辑。用户可以通过模糊背景、去除瑕疵、添加颜色或擦除整个物体，无需进行手动选择。同时该模型支持一次融合最多三张图像。

目前用户可通过Gemini App、API等方式访问，其API定价为每百万输出token30美元，单张图像成本约0.039美元。

(来源：新浪科技)

标签：ChatGPT 媒体

版权说明：本文为转载文章，源于互联网,由程序alpha自动采集，于2025年08月27日最后更新
转载声明：谷歌发布图像生成模型Gemini 2.5 Flash Image：多方面优于GPT-4o | 少数派报告 +复制链接

少数派报告-全球投资导向

我们将专门针对全球的经济政治状况，做最及时的分析与资讯共享。同时将对国内的市场做适度的点评，提供各类关键分析资讯我们的口号是：金钱永不眠！

weixin

产品与服务

关于我们

Privacy Policy · Terms of Service · Contact Us

Copyright © 2014-2022 少数派报告保留所有权利 (Registered:USA CA Fremont 94536)