谷歌推出Gemini 2.5图像编辑模型，精准修图轻松实现

发布时间：2025年8月28日来源：szf

快速阅读: 谷歌 DeepMind 推出 Gemini2.5Flash 图像编辑模型，用户可通过文字指令精准修改照片，保持角色一致性，支持局部编辑和多图融合，每张图像成本约 0.039 美元。

近日，谷歌 DeepMind 推出全新图像编辑模型 Gemini2.5Flash。这款升级版模型在 Gemini 应用中为用户提供更精准的图像编辑体验，用户可通过文字指令大幅修改照片，而不影响人物和动物的外观。

与之前版本相比，Gemini2.5Flash 在处理复杂文字指令时表现出更高的准确性，在多项任务中超越了 ChatGPT 所使用的 GPT-4。这使得用户在图像编辑时能更轻松地实现创意。

Gemini2.5Flash 的一大亮点是“角色一致性”功能。即使在生成多张图像时，用户指定的人物、动物或物体的外观也能保持一致，无论姿势、背景或光线如何变化。这一功能对于品牌系列照片、产品多角度展示尤为有用，显著提高了素材与产品目录的制作效率。

此外，Gemini2.5Flash 支持精准的局部文字编辑，用户无需手动圈选，即可轻松实现背景虚化、去除瑕疵、添加颜色或移除物体等操作。该模型还能一次性融合最多三张图像，例如将产品照与室内照片结合成逼真场景。同时，它具备“风格迁移”功能，可将一种纹理、颜色或图案应用到另一物体上，保持形状与细节的完整性。

Gemini2.5Flash 的“现实推理”功能突破了传统图像编辑的限制，能够模拟简单的因果关系，如生成气球飞向仙人掌及其后续结果的画面。这些创新功能使 Gemini2.5Flash 不仅成为强大的修图工具，更是一个激发用户创造力的平台。

目前，用户只需在 Gemini 应用中将模型切换至“Flash”模式即可体验新功能。生成的图像将附带可见水印和不可见的 SynthID 数字水印，以确保版权保护。开发者也可通过 Gemini API、Google AI Studio 和 Vertex AI 进行试用，使用费用为每百万输出 token 30 美元，单张图像成本约为 0.039 美元。

(以上内容均由Ai生成)