Gemini 可以成为最大的 AI 平台，只要 Google 将其集成到更多领域 [视频]

快速阅读: 据《9to5谷歌》最新报道，谷歌Gemini正快速发展，凭借广泛的生态系统和集成能力，可能长期主导人工智能领域。与其他平台相比，Gemini不仅限于文本交互，还涉足视觉搜索等功能，逐步融入日常工具中。尽管存在争议，这种深度集成可能是其成功关键。

根据谷歌的说法，我们正处于“双子座时代”。尽管这个领域还有其他参与者，但如果公司能够继续整合，我们可能会在这个时代停留很长时间。

目录
– 人工智能正在以惊人的速度发展
– 不是最热门的目的地，但出现在更多地方
– 进入视觉人工智能时代

人工智能正在以惊人的速度发展
进入视觉人工智能时代
支持和反对人工智能的论点在两边都极具说服力。有人工智能取代人类的想法让人感到厌恶，但在各种情况下将其作为工具使用时，像Gemini这样的平台可以真正成为你日常工作流程中的有用补充。仅在过去三到四年里，人工智能发展的格局就令人震惊。我们从笨拙的图像生成已经发展到几乎可以在瞬间实现逼真的视频片段。变化或飞跃的速度简直令人难以置信。

广告 – 向下滚动查看更多内容

就个人而言，我是一个人工智能怀疑论者。我觉得它就像Photoshop里的钢笔工具一样，你可以用一点。也许是一个简单的编辑或校对/重述工具，你可以用来写作或文档。也许图像生成甚至可以用作娱乐目的，比如制作表情包。我对人工智能可能并且，说实话，取代艺术家和音乐家的想法感到恶心，但同时，如果正确使用，它可以成为辅助这些创造性努力的一种方式。总会有不法分子和试图利用人工智能作为捷径来完成需要时间构建或学习的事情的人。就个人而言，我是一个人工智能怀疑论者。我觉得它就像Photoshop里的钢笔工具一样，你可以用一点。也许是一个简单的编辑或校对/重述工具，你可以用来写作或文档。也许图像生成甚至可以用作娱乐目的，比如制作表情包。我现在下台了，但观点仍然成立。如果我们有大量的人工智能普及，我们将都需要更加意识到风险和好处。

不是最热门的目的地，但出现在更多地方
回到Gemini，虽然大多数人可能知道ChatGPT或者更了解OpenAI的平台，但该公司尚未盈利，也无法与谷歌和Gemini武器库中最大的武器之一——潜在用户群相匹敌。有许多报道声称，OpenAI的网站每月比Gemini的网站多出数百万次访问量，但这未能看到Gemini已经在世界上最常用的应用和服务中开始获得集成。这可能是支持Gemini成为主导的最强有力论据，至少在理论上，如果你已经有或使用谷歌产品，就不需要做任何事情。Gemini将取代谷歌助手，像Gmail、照片和地图等应用和服务，以及庞大的谷歌应用套件正在缓慢地获得利用Gemini功能的功能。其中一些集成是简单的搜索或摘要工具，但OpenAI无法通过与微软、苹果等公司正在积极建立的合作关系达到相同的安装基础。行业内没有人能在没有广泛推动人们采用其平台的情况下达到这种潜在的覆盖范围。推动超过10亿人使用你的产品将花费巨额资金，而谷歌目前拥有这种覆盖范围，且几乎无需支出。Android是世界上最受欢迎的移动平台，随着Gemini即将成为默认语音助手，大量的人将接触到这项服务。

对于普通用户来说，免费层级和AI高级计划之间的区别几乎没有。谷歌一直擅长向基本账户推出功能，模型更新足够大，可以注意到响应和推理方面的改进，以及查询和问题所获得的信息质量。在这种情况下，将功能限制在付费墙后面并不是一个可行的长期策略或解决方案，因为限制可用性对于最基本的用途可能是可以接受的，但人们会愿意每月支付超过20美元来做一些更复杂的任务吗？我可以打赌不会。

ChatGPT只能提供对其人工智能平台的访问——主要是在chatgpt.com或专用移动应用程序上。谷歌有云存储、电子邮件服务、照片存储，以及YouTube平台带来的潜在视频和音乐支持，这只是冰山一角。有可能谷歌会将所有这些打包成一个统一费用，即使如此，也不会超过每月25美元。正如我所说，OpenAI只有ChatGPT作为其“核心”产品，因此它无法在所有这些方面进行竞争。该公司还需要你特意去使用聊天机器人功能，因此它永远无法像ChatGPT那样普遍，尽管ChatGPT几乎已经成为人工智能的代名词。

再回到Android上。由于Gemini实际上与操作系统分离，你不需要特定的更新来获取最新功能。谷歌只需翻转开关，数十亿人就可以使用最新的模型或访问最新的开发成果。从最终用户的角度来看，这通常是最好的，至少在新功能方面是如此。考虑到新Gemini模型推出的速度快度时，这一点尤为重要。从Bard早期到现在，你能做的事情的质量和一致性有了极大的提高。这不仅仅是伪装成“有用”工具的小把戏。Gemini现在可以做到几年前不可能的事情。

进入视觉人工智能时代
Gemini最大的潜在优势之一是视觉搜索。Circle to Search是早期版本之一，但Astra驱动的视觉搜索的引入是我们迈向世界级相机的第一步，它可以推理并提供有用的信息。它仍在高级计划订阅者中推出，但想法是你可以让Gemini访问相机，然后实时反馈你的问题。这是Gemini Live，但加入了视觉元素，它可以基于相机或屏幕内容给你回应。OpenAI有GPT-4o的视觉能力，但现在还没有集成或没有集成。也许将来会有，但Gemini与Astra一起，在理论上可以做更多的事情。

虽然其他平台如DeepSeek在特定领域（如编码）取得了进展，Claude也因其对对话式人工智能和安全性的重视而获得了关注，但他们缺乏Gemini广泛的生态系统和集成潜力。Gemini无缝集成到谷歌生态系统（从地图到照片）的能力，为用户提供了竞争对手目前无法匹配的体验。这种级别的集成，加上Gemini快速发展的步伐，使谷歌在长期内主导人工智能领域成为可能，而公司有足够的资金和跑道有效地耗尽竞争对手。

我不是主张一个人工智能领域的主导玩家，但从远处看，这看起来像是剧本。最终，虽然其他参与者专注于利基优势，Gemini能够无处不在并深入集成到我们每天使用的工具中，这可能是决定其成功的关键因素。人工智能兄弟们无疑会不同意，你可能也会。竞争让竞争对手保持敏锐，至少在理论上，这是科技领域最好的事情之一。

这种级别的集成，加上Gemini快速发展的步伐，使谷歌在长期内主导人工智能领域成为可能，而公司有足够的资金和跑道有效地耗尽竞争对手。我不是主张一个人工智能领域的主导玩家，但从远处看，这看起来像是剧本。无论谁最终主导或领导人工智能集成，这是一个有趣的时代，因为我们正在远离传统的软件范式，看到人工智能在我们的设备、软件和服务等方面扮演更大的角色。几乎就像你无法逃避它——无论是对是错。

将9to5Google添加到你的谷歌新闻源中。
FTC：我们使用赚取收入的自动附属链接。更多信息。

你正在阅读9to5Google——专家们每天都报道关于谷歌及其周边生态系统的新闻。一定要查看我们的主页获取最新的新闻，并在推特、脸书和领英和上关注9to5Google，以保持联系。不知道从哪里开始？查看我们的独家故事、评论、教程、指南，并订阅我们的YouTube频道。

(以上内容均由Ai生成)