本周 AI 盛会的 3 大重磅炸弹
快速阅读: 《VentureBeat 公司》消息,微软、谷歌和Anthropic纷纷发布重要AI工具,涵盖代理交流、编码能力和搜索模式革新。这些进展预示着AI领域即将迎来重大变革,影响从开发者到企业的方方面面。
订阅我们的每日和每周简报,获取行业领先的人工智能报道的最新动态和独家内容。了解更多篮球有疯狂三月,科技界有消费电子展。人工智能一直在等待属于它的高光时刻,而本周或许就是那个时刻。随着微软Build大会和谷歌I/O开发者大会接连举行,这已经注定是一个重要的星期。微软单独宣布了50个新的人工智能工具,而谷歌紧随其后仅一天之后也推出了自己的系列工具。然后,出人意料的是,周四Anthropic推出了Claude 4,这是其大型语言模型(LLM)的最新版本。虽然这些公告中包含了一些令人惊叹的小玩意(谷歌虚拟试穿,我们正在看你),但任何打算利用人工智能开展业务的人都会找到不少期待之处,甚至有一些新的工具可以立即使用。跟不上节奏怎么办?以下是各家公司最重要的公告,以及它们将如何在未来几个月重塑人工智能格局。
**微软希望人工智能代理能够相互交流**
代理是大型语言模型(LLM)发展的明显下一步。但有一个主要问题阻碍了它们:它们不能轻易地相互交互。一个代理负责预订商务旅行机票,另一个代理负责预订酒店,听上去很棒,直到你到达伦敦却在马德里有了房间。微软通过引入模型上下文协议(MCP),一种不同代理——即使使用不同的LLM——进行通信的标准方式,迈出了解决这一僵局的重要一步。Anthropic实际上于2024年11月制定了该标准。不过,微软的采用意味着它正迅速成为未来代理架构中的重要组成部分,就像HTML之于开放网络一样。微软还把MCP整合进Azure AI Foundry,这是一个用于创建人工智能应用程序的工具,因此用户可以立即开始构建相互交互的代理。那么,这有什么意义?代理人工智能仍处于婴儿期,但广泛采用的标准将为下一代代理工具铺平道路。竞争对手之间的标准化意味着当你自动化流程时,你可以选择未来的LLM,而不是陷入单一公司的生态系统。
**Claude 4让编码员着迷**
尽管在生成式人工智能市场中只占3.3%的份额,ChatGPT和Gemini常常掩盖了Claude的身影。然而,开发人员不会想错过Opus 4和Sonnet 4,它们在周四意外出现,并带来了令人印象深刻的编码功能。最令人印象深刻的是,Claude 4在其“扩展思考”模式下可运行长达七小时,这允许它采取数千步并使用工具如网络搜索。Anthropic声称它还将探索更多方法,捕捉更多错误,并分解更复杂问题的推理。凭借这些改进,Claude Opus 4在流行的SWE-bench软件工程基准测试中以72.5%的得分位居榜首,超过了OpenAI o3(69.1%)和Gemini 2.5 Pro(63.2%)。那么,这有什么意义?虽然基准测试并不总是能讲述整个故事,但Claude已经在开发人员中赢得了LLM首选的声誉。Claude 4通过为软件工程社区提供改进进一步巩固了这一声誉,这将有助于将其与更通用的同行区分开来。
**谷歌人工智能模式颠覆搜索**
谷歌在I/O 2025大会上推出了一系列面向消费者的人工智能应用,从上述的虚拟试穿到谷歌光束功能,后者借助六个不同的摄像角度和大量人工智能将2D视频流转换成类似全息图的实时模型。然而,对于企业来说,最具影响力的变化可能是搜索的人工智能模式。与之前的AI概览类似,AI模式更深入地将Gemini集成到搜索体验中。当你激活AI模式搜索时,谷歌执行“查询拆分技术”,即将查询拆分为多个子查询并同时执行,然后将结果拼接在一起。虽然这种模式之前对谷歌实验室用户可用,但本周它将走向主流。那么,这有什么意义?即使你个人不使用AI模式,任何谷歌搜索的变化都将对数百万依赖其吸引流量的企业产生影响。AI概览颠覆了搜索引擎优化(SEO)行业,而AI模式可能会更加戏剧性。大多数人在线查找信息的方式正在改变,并且速度很快。
**VB每日商业案例洞察**
如果你想给老板留下深刻印象,VB每日可以帮助你实现这一点。我们为你提供公司如何使用生成式人工智能的内部情报,从监管变化到实际部署,这样你就可以分享见解以获得最大回报。现在就订阅查看我们的隐私政策。
感谢订阅。
查看更多VB新闻简报。
出现错误。
(以上内容均由Ai生成)