谷歌的 Gemini AI 可以创建像 Grok 3 和 ChatGPT 这样的免费吉卜力风格图像吗?
快速阅读: 《政治家》消息,谷歌意外开放Gemini 2.5 Pro给非付费用户,以应对竞争压力。该模型虽在推理能力上表现优秀,但缺乏内置图像生成功能,难以满足吉卜力风格需求。谷歌此举旨在提升用户群体,增强竞争力。
谷歌意外地向非付费用户开放了其最新推出的Gemini 2.5 Pro模型。按照原计划,这项功能本应仅限于Gemini高级订阅者使用。此举反映出谷歌正在面对日益激烈的市场竞争,尤其是来自OpenAI的ChatGPT和Anthropic的Claude的压力。Gemini AI的推出正值吉卜力风格图像在社交媒体上流行之际,这种趋势主要归因于ChatGPT内置的图像生成功能。然而,谷歌的新Gemini模型并不支持原生图像创作,这引发了人们对其是否能满足吉卜力风格需求的疑问。
Gemini 2.5 Pro与替代品对比
Gemini 2.5 Pro是一款推理模型,类似于OpenAI的GPT-4o和DeepSeek R1。谷歌宣称其在数学、科学、推理和编码等领域取得了显著进步,并在伯克利研究团队的人类最后一考以及LMArena等关键AI基准测试中表现优异。
尽管OpenAI的GPT-4o因其无缝的多模态能力而备受瞩目,谷歌对于Gemini 2.5 Pro是否能够独立生成图像的态度尚不明朗。公司官方声明指出该模型具备处理和理解文本、声音、图片、视频及代码库的能力,但并未明确提及内置图像生成功能。这使用户怀疑它可能需要借助外部AI工具才能实现这一功能。
那么,Gemini 2.5 Pro缺乏“吉卜力化”功能吗?
虽然大家都对吉卜力风格的AI画作充满期待,但用户惊讶地发现Gemini 2.5 Pro目前缺少内联样式转换功能。尝试使用简单命令如“吉卜力化这张图片”的人收到了错误提示:“抱歉,我无法完成此操作。将‘吉卜力’风格应用到你的图片所需的功能当前不可用。”这表明谷歌的Imagen 3模型(用于驱动Gemini图像生成的模型)缺乏OpenAI的ChatGPT所展现的那种流畅艺术表现力。例如,GPT-4o能够在不依赖第三方模型的情况下生成吉卜力风格的艺术作品,使其成为AI驱动创意领域的热门选择。
谷歌决定向免费用户提供Gemini 2.5 Pro可能是为了保持其AI用户群体。OpenAI的ChatGPT继续主导公众认知,特别是在其免费层级的多模态能力方面。通过向非订阅用户开放Gemini 2.5 Pro,谷歌或许希望借此提高采用率并展示其推理方面的进展——即便在创意AI功能方面仍存在一定差距。
此外阅读:吉卜力风格的开斋节?你一定要看看这个令人赞叹的艺术趋势!
(以上内容均由Ai生成)