谷歌推出Gemini 2.5 Flash图像编辑模型,精准修图更轻松
快速阅读: 谷歌 DeepMind 推出 Gemini2.5Flash 图像编辑模型,提供精准文字指令编辑、角色一致性、局部编辑、风格迁移和现实推理等功能,超越 GPT-4,适用于品牌照片和产品展示,生成图像附带水印,API 使用费为每百万 token 30 美元。
近日,谷歌 DeepMind 推出了全新图像编辑模型 Gemini2.5Flash。这款升级版模型在 Gemini 应用中为用户提供更精准的图像编辑体验,用户可以通过文字指令大幅修改照片,同时不影响人物和动物的外观。
与之前的图像生成工具相比,Gemini2.5Flash 在处理复杂文字指令时表现出更高的准确性,甚至在多项任务中超越了 ChatGPT 使用的 GPT-4。这一进步使用户在进行图像编辑时能更轻松地实现创意。
Gemini2.5Flash 的一大亮点是其“角色一致性”功能。即使在生成多张图像时,用户指定的人物、动物或物体的外观也能保持一致,无论姿势、背景或光线如何变化。这一功能对品牌系列照片和产品多角度展示尤其有价值,大大提升了素材与产品目录的制作效率。
此外,Gemini2.5Flash 支持精准的局部文字编辑,用户无需手动圈选,便能轻松实现背景虚化、去除瑕疵、添加颜色或移除物体等多种操作。它甚至能一次融合最多三张图像,例如将产品照与室内照片结合成一个逼真的场景。此外,它还具备“风格迁移”功能,可以将一种纹理、颜色或图案应用到另一物体上,同时保持形状与细节的完整性。
Gemini2.5Flash 的“现实推理”功能突破了传统图像编辑的限制,能够模拟简单的因果关系,比如生成气球飞向仙人掌及其后续结果的画面。这些创新功能使 Gemini2.5Flash 不仅是一个强大的修图工具,更是一个让用户体验创造力的平台。
目前,用户只需在 Gemini 应用中将模型切换至“Flash”即可体验这一新功能。生成的图像将附带可见水印和不可见的 SynthID 数字水印,以确保作品的版权保护。开发者们也可以通过 Gemini API、Google AI Studio 和 Vertex AI 进行试用,使用费用为每百万输出 token 30 美元,单张图像的成本约为 0.039 美元。
(以上内容均由Ai生成)