AI

谷歌推出Gemini 2.5 Flash,精准修图轻松实现

发布时间:2025年8月27日    来源:szf
谷歌推出Gemini 2.5 Flash,精准修图轻松实现

快速阅读: 谷歌 DeepMind 推出 Gemini2.5Flash 图像编辑模型,提供精准文字指令编辑,保持角色一致性,支持局部编辑和风格迁移,成本约 0.039 美元/张。

近日,谷歌 DeepMind 推出了全新的 Gemini2.5Flash 图像编辑模型。这款升级版模型在 Gemini 应用中为用户提供更加精准的图像编辑体验,用户可以通过文字指令对照片进行大幅修改,而不会影响人物和动物的外观。

与之前的图像生成工具相比,Gemini2.5Flash 在处理复杂的文字指令时展现了更高的准确性,甚至在多项任务中超过了 ChatGPT 使用的 GPT-4。这一进步使用户在进行图像编辑时,能够更轻松地实现创意。

Gemini2.5Flash 的一大亮点是其“角色一致性”功能。即使在生成多张图像时,用户指定的人物、动物或物体的外观也能保持一致,无论姿势、背景或光线如何变化。这一功能对品牌的系列照片和产品的多角度展示尤其有价值,大大提升了素材与产品目录的制作效率。

此外,Gemini2.5Flash 支持精准的局部文字编辑,用户无需手动圈选,就能轻松实现背景虚化、去除瑕疵、添加颜色或移除物体等多种操作。它甚至能够一次融合最多三张图像,例如将产品照与室内照片结合成一个逼真的场景。此外,它还具备“风格迁移”功能,可以将一种纹理、颜色或图案应用到另一物体上,同时保持形状与细节的完整性。

Gemini2.5Flash 的“现实推理”功能突破了传统图像编辑的限制,能够模拟简单的因果关系,比如生成气球飞向仙人掌及其随后的结果画面。这些创新功能使 Gemini2.5Flash 不仅成为强大的修图工具,更是一个让用户发挥想象力的创作平台。

目前,用户只需在 Gemini 应用中将模型切换至“Flash”即可体验这款新功能。生成的图像将附带可见水印和不可见的 SynthID 数字水印,以确保作品的版权保护。开发者们也可以通过 Gemini API、Google AI Studio 和 Vertex AI 进行试用,使用费用为每百万输出 token 30 美元,单张图像的成本约为 0.039 美元。

(以上内容均由Ai生成)

你可能还想读

英伟达4B小模型登顶ARC评测,成本仅GPT-5 Pro的136

英伟达4B小模型登顶ARC评测,成本仅GPT-5 Pro的136

快速阅读: 12月8日消息,英伟达推出4B参数小模型NVARC,在ARC-AGI2评测中以27.64%准确率超越GPT-5Pro,单任务推理成本仅0.2美元,凭借零预训练策略和合成数据实现高效低成本部署。 近日,英伟达研发的4B参数小模型N […]

发布时间:2025年12月8日
Meta收购Limitless加码AI可穿戴设备

Meta收购Limitless加码AI可穿戴设备

快速阅读: 据最新消息,Meta收购AI可穿戴设备公司Limitless,后者以无屏幕智能吊坠著称,具备语音交互与实时转录功能;收购后团队并入Meta,专注AI硬件研发,现有产品将停售但提供一年技术支持。 日前,美国科技企业Meta宣布收购 […]

发布时间:2025年12月8日
沐曦股份科创板申购中签率公布

沐曦股份科创板申购中签率公布

快速阅读: 12月8日消息,沐曦集成电路科创板IPO网上申购户数达517.52万户,启动回拨后最终中签率升至0.03348913%,拟募资39.04亿元用于高性能GPU研发及产业化。 12月8日,国产GPU企业沐曦集成电路(上海)股份有限公 […]

发布时间:2025年12月8日
阿里推Qwen3-TTS:49音色10语9方言,WER碾压商用模型

阿里推Qwen3-TTS:49音色10语9方言,WER碾压商用模型

快速阅读: 12月8日消息,阿里巴巴推出通义千问Qwen3-TTS语音合成模型,支持49种音色、10种语言及9种方言,免费开放每月百万字符额度,并在上海120所中小学试点教育应用。 今日,阿里巴巴正式推出通义千问Qwen3系列新成员——Qw […]

发布时间:2025年12月8日
京东云JoyBuilder千卡训练提速3.5倍

京东云JoyBuilder千卡训练提速3.5倍

快速阅读: 12月8日消息,京东云JoyBuilder平台完成关键升级,支持GR00T N1.5千卡训练,兼容LeRobot框架,训练效率提升3.5倍,亿级数据训练从15小时缩短至22分钟。 日前,京东云JoyBuilder模型开发平台完成 […]

发布时间:2025年12月8日
麦肯锡:AI将取代8亿岗位,同时创造新机遇

麦肯锡:AI将取代8亿岗位,同时创造新机遇

快速阅读: 据麦肯锡全球研究院消息,到2030年全球或有8亿岗位被人工智能取代,同时创造1.3亿至2.3亿新岗位,冲击驾驶、物流、医疗、法律等多个行业,专家呼吁加强再培训与政策应对。 日前,人工智能技术快速发展引发全球关注。加州大学伯克利分 […]

发布时间:2025年12月8日
可灵AI上线主体库,角色跨场景“永不变脸”

可灵AI上线主体库,角色跨场景“永不变脸”

快速阅读: 12月8日消息,快手旗下可灵AI发布“主体库”,为O1视频模型新增长期记忆能力,用户上传单图即可跨场景调用一致角色,主体一致性超96%,并推分级服务与2025年多人功能规划。 今日,快手旗下可灵AI正式发布“主体库”(Subje […]

发布时间:2025年12月8日
n1n.ai 重塑大模型API成本与体验

n1n.ai 重塑大模型API成本与体验

快速阅读: 据最新消息,大模型API平台n1n.ai整合近500种开源与闭源模型,价格低至官方十分之一,响应快、稳定性高,已助企业降本超70%并提升用户满意度。 近日,大模型API服务平台n1n.ai凭借高性价比、高稳定性及丰富模型选择,正 […]

发布时间:2025年12月8日