谷歌连续炸场!新一代AI图像生成模型发布,还能识别真假AI图片
快速阅读: 谷歌发布基于Gemini 3 Pro的图像生成模型Nano Banana Pro,提升文字渲染、图像分辨率及局部编辑功能,支持2K/4K分辨率与多输入一致性。新增简便数字水印验证方法,提高AI内容透明度。
科技巨头谷歌近期频繁发布AI(人工智能)模型。当地时间11月20日,谷歌旗下的图像生成模型Nano Banana在推出三个月后进行了重大更新,基于谷歌最新的大模型Gemini 3 Pro打造的Nano Banana Pro正式发布。此外,谷歌为用户提供了一种更为简便的数字水印验证方法,提高了AI内容的透明度。
据谷歌介绍,Nano Banana Pro具备“前所未有的控制力、改进的文字呈现和增强的世界知识”,能将用户的创意转化为工作室级别的设计。这款新模型在细节表现、图像分辨率和文本渲染精度等方面都有所提升,支持多种风格、字体和语言的文本生成。
首先,Nano Banana Pro的文字渲染能力显著增强,结合多模态理解技术,该模型可直接将图片中的文字翻译成其他语言,同时保持原有设计风格不变。此外,Nano Banana Pro还改进了局部编辑功能,新增了互联网搜索能力。用户可以自由选择、优化和调整图像的任何部分,包括调整相机角度、改变焦点和色彩分级,甚至调整场景光照。Nano Banana Pro支持生成最高达2K和4K分辨率的图像,并允许调整宽高比。
在一致性方面,Nano Banana Pro同样取得了显著进步,现在最多可输入14张图片,在生成复杂场景时保持一致性。该模型还能在生成结果中保持最多5个人物的一致性和相似度。根据提示词,Nano Banana Pro能在复杂构图中保持多输入的一致性。
与此同时,谷歌宣布用户可以通过Gemini来鉴定图片是否由谷歌AI生成。所有由谷歌工具生成的媒介均嵌入了SynthID数字水印,用户可以从现在起将图片上传至Gemini应用,轻松查询图片是否由Google AI生成,这一验证方式将很快扩展至音频和视频文件。
目前,Nano Banana Pro已在Gemini应用中上线,免费用户享有有限的使用次数,超出后将自动切换回Nano Banana模型,而Google AI Plus、Pro和Ultra订阅用户则享有更高的使用配额。该模型也从即日起在设计软件Adobe Photoshop和Firefly中提供。
Nano Banana Pro和Gemini 3的发布受到了热烈欢迎。两天前,谷歌正式推出了新一代多模态AI模型Gemini 3,包括Gemini 3 Pro和增强型推理模式Gemini 3 Deep Think两个版本。该模型基于谷歌的TPU(张量处理单元)训练而成,不仅在各项基准测试中表现出色,还延续了Gemini系列在多模态领域的优势。
在AI领域的竞争中,谷歌一直致力于追赶OpenAI。有分析指出,随着Gemini 3的发布,两家公司的竞争愈发激烈。一周前,OpenAI发布了更加智能、对话感更强且更易定制的GPT-5.1。11月19日,OpenAI又意外发布了GPT-5.1 Pro和代码模型GPT-5.1-Codex-Max。
在Gemini 3的发布会上,谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)透露,目前每月有20亿用户使用AI概览功能(谷歌搜索的AI Overviews功能),Gemini应用的月活跃用户数已超过6.5亿。
受市场普遍下跌影响,11月20日,谷歌(Nasdaq: GOOGL)股价下跌1.03%,收盘价为每股289.98美元,总市值达到3.49万亿美元。今年以来,谷歌的股价已上涨超过50%。
(以上内容均由Ai生成)