谷歌连续炸场！新一代AI图像生成模型发布，还能识别真假AI图片

发布时间：2025年11月21日来源：szf

快速阅读: 谷歌发布基于Gemini 3 Pro的图像生成模型Nano Banana Pro，提升文字渲染、图像分辨率及局部编辑功能，支持2K/4K分辨率与多输入一致性。新增简便数字水印验证方法，提高AI内容透明度。

科技巨头谷歌近期频繁发布AI（人工智能）模型。当地时间11月20日，谷歌旗下的图像生成模型Nano Banana在推出三个月后进行了重大更新，基于谷歌最新的大模型Gemini 3 Pro打造的Nano Banana Pro正式发布。此外，谷歌为用户提供了一种更为简便的数字水印验证方法，提高了AI内容的透明度。

据谷歌介绍，Nano Banana Pro具备“前所未有的控制力、改进的文字呈现和增强的世界知识”，能将用户的创意转化为工作室级别的设计。这款新模型在细节表现、图像分辨率和文本渲染精度等方面都有所提升，支持多种风格、字体和语言的文本生成。

首先，Nano Banana Pro的文字渲染能力显著增强，结合多模态理解技术，该模型可直接将图片中的文字翻译成其他语言，同时保持原有设计风格不变。此外，Nano Banana Pro还改进了局部编辑功能，新增了互联网搜索能力。用户可以自由选择、优化和调整图像的任何部分，包括调整相机角度、改变焦点和色彩分级，甚至调整场景光照。Nano Banana Pro支持生成最高达2K和4K分辨率的图像，并允许调整宽高比。

在一致性方面，Nano Banana Pro同样取得了显著进步，现在最多可输入14张图片，在生成复杂场景时保持一致性。该模型还能在生成结果中保持最多5个人物的一致性和相似度。根据提示词，Nano Banana Pro能在复杂构图中保持多输入的一致性。

与此同时，谷歌宣布用户可以通过Gemini来鉴定图片是否由谷歌AI生成。所有由谷歌工具生成的媒介均嵌入了SynthID数字水印，用户可以从现在起将图片上传至Gemini应用，轻松查询图片是否由Google AI生成，这一验证方式将很快扩展至音频和视频文件。

目前，Nano Banana Pro已在Gemini应用中上线，免费用户享有有限的使用次数，超出后将自动切换回Nano Banana模型，而Google AI Plus、Pro和Ultra订阅用户则享有更高的使用配额。该模型也从即日起在设计软件Adobe Photoshop和Firefly中提供。

Nano Banana Pro和Gemini 3的发布受到了热烈欢迎。两天前，谷歌正式推出了新一代多模态AI模型Gemini 3，包括Gemini 3 Pro和增强型推理模式Gemini 3 Deep Think两个版本。该模型基于谷歌的TPU（张量处理单元）训练而成，不仅在各项基准测试中表现出色，还延续了Gemini系列在多模态领域的优势。

在AI领域的竞争中，谷歌一直致力于追赶OpenAI。有分析指出，随着Gemini 3的发布，两家公司的竞争愈发激烈。一周前，OpenAI发布了更加智能、对话感更强且更易定制的GPT-5.1。11月19日，OpenAI又意外发布了GPT-5.1 Pro和代码模型GPT-5.1-Codex-Max。

在Gemini 3的发布会上，谷歌首席执行官桑达尔·皮查伊（Sundar Pichai）透露，目前每月有20亿用户使用AI概览功能（谷歌搜索的AI Overviews功能），Gemini应用的月活跃用户数已超过6.5亿。

受市场普遍下跌影响，11月20日，谷歌（Nasdaq: GOOGL）股价下跌1.03%，收盘价为每股289.98美元，总市值达到3.49万亿美元。今年以来，谷歌的股价已上涨超过50%。

(以上内容均由Ai生成)