谷歌的 Gemini AI 可以创建像 Grok 3 和 ChatGPT 这样的免费吉卜力风格图像吗？

发布时间：2025年3月31日来源：szf

快速阅读: 《政治家》消息，谷歌意外开放Gemini 2.5 Pro给非付费用户，以应对竞争压力。该模型虽在推理能力上表现优秀，但缺乏内置图像生成功能，难以满足吉卜力风格需求。谷歌此举旨在提升用户群体，增强竞争力。

谷歌意外地向非付费用户开放了其最新推出的Gemini 2.5 Pro模型。按照原计划，这项功能本应仅限于Gemini高级订阅者使用。此举反映出谷歌正在面对日益激烈的市场竞争，尤其是来自OpenAI的ChatGPT和Anthropic的Claude的压力。Gemini AI的推出正值吉卜力风格图像在社交媒体上流行之际，这种趋势主要归因于ChatGPT内置的图像生成功能。然而，谷歌的新Gemini模型并不支持原生图像创作，这引发了人们对其是否能满足吉卜力风格需求的疑问。

Gemini 2.5 Pro与替代品对比
Gemini 2.5 Pro是一款推理模型，类似于OpenAI的GPT-4o和DeepSeek R1。谷歌宣称其在数学、科学、推理和编码等领域取得了显著进步，并在伯克利研究团队的人类最后一考以及LMArena等关键AI基准测试中表现优异。

尽管OpenAI的GPT-4o因其无缝的多模态能力而备受瞩目，谷歌对于Gemini 2.5 Pro是否能够独立生成图像的态度尚不明朗。公司官方声明指出该模型具备处理和理解文本、声音、图片、视频及代码库的能力，但并未明确提及内置图像生成功能。这使用户怀疑它可能需要借助外部AI工具才能实现这一功能。

那么，Gemini 2.5 Pro缺乏“吉卜力化”功能吗？
虽然大家都对吉卜力风格的AI画作充满期待，但用户惊讶地发现Gemini 2.5 Pro目前缺少内联样式转换功能。尝试使用简单命令如“吉卜力化这张图片”的人收到了错误提示：“抱歉，我无法完成此操作。将‘吉卜力’风格应用到你的图片所需的功能当前不可用。”这表明谷歌的Imagen 3模型（用于驱动Gemini图像生成的模型）缺乏OpenAI的ChatGPT所展现的那种流畅艺术表现力。例如，GPT-4o能够在不依赖第三方模型的情况下生成吉卜力风格的艺术作品，使其成为AI驱动创意领域的热门选择。

谷歌决定向免费用户提供Gemini 2.5 Pro可能是为了保持其AI用户群体。OpenAI的ChatGPT继续主导公众认知，特别是在其免费层级的多模态能力方面。通过向非订阅用户开放Gemini 2.5 Pro，谷歌或许希望借此提高采用率并展示其推理方面的进展——即便在创意AI功能方面仍存在一定差距。

此外阅读：吉卜力风格的开斋节？你一定要看看这个令人赞叹的艺术趋势！

(以上内容均由Ai生成)