AI 支持 Web 的战斗:NLweb 和企业需要了解的内容
快速阅读: 据《VentureBeat 公司》称,NLWeb是一种新协议,能让网站轻松添加AI对话界面,使网站变成可用自然语言查询的人工智能应用。它基于现有结构化数据格式,可与多种数据库兼容。微软已有多家合作伙伴采用NLWeb,包括芝加哥公共媒体、Allrecipes等。企业应根据自身需求决定是否立即采用。
订阅我们的每日和每周简报,获取行业前沿人工智能报道的最新资讯和独家内容。了解更多信息
上世纪九十年代末的互联网初期,搜索功能尚可,但不够理想,且难以找到所需内容。这推动了早期二十一世纪聚合协议的出现,其中Atom和RSS(简易聚合)为网站所有者提供了一种简便方法,使标题及其他内容更易于访问和搜索。在当今人工智能时代,一批新协议正在涌现,以实现相同的基本目标。这一次,不是为了让人类更方便地发现网站,而是为了让网站更易于被人工智能使用。Anthropic的模型控制协议(MCP)、Google的代理到代理(Agent2Agent)以及大型语言模型/LLMs.txt都是现有的一些努力。最新的协议是微软的开源NLWeb(自然语言网络)项目,该项目是在Build 2025大会上宣布的。NLWeb还直接关联于第一代网络聚合标准,由RV Guha构思并创建,他协助创建了RSS、RDF(资源描述框架)及schema.org。
NLWeb让网站能轻松添加人工智能驱动的对话界面,从而有效把任何网站转变成用户可用自然语言查询内容的人工智能应用。NLWeb并非旨在与其他协议竞争,而是构建于这些协议之上。新协议利用现有结构化数据格式如RSS,每个NLWeb实例均作为MCP服务器运行。
“NLWeb的理念是,对于已有网站或API的人而言,这是一种极为简便的方法,可将其网站或API变为自主应用,”微软首席技术官Kevin Scott在Build 2025主题演讲中表示,“你可以将其视作自主网络的HTML。”
NLWeb让网站能轻松添加人工智能驱动的对话界面,从而有效把任何网站转变成用户可用自然语言查询内容的人工智能应用。NLWeb并非旨在与其他协议竞争,而是构建于这些协议之上。新协议利用现有结构化数据格式如RSS,每个NLWeb实例均作为MCP服务器运行。
NLWeb如何为企业赋能人工智能网络
NLWeb让网站能轻松添加人工智能驱动的对话界面,从而有效把任何网站转变成用户可用自然语言查询内容的人工智能应用。NLWeb并非旨在与其他协议竞争,而是构建于这些协议之上。新协议利用现有结构化数据格式如RSS,每个NLWeb实例均作为MCP服务器运行。
NLWeb通过一个简单流程将网站转化为人工智能驱动的体验,此流程基于现有网络基础设施并运用现代人工智能技术。NLWeb让网站能轻松添加人工智能驱动的对话界面,从而有效把任何网站转变成用户可用自然语言查询内容的人工智能应用。NLWeb并非旨在与其他协议竞争,而是构建于这些协议之上。新协议利用现有结构化数据格式如RSS,每个NLWeb实例均作为MCP服务器运行。
基于现有数据:系统首先利用网站已发布的结构化数据,包括标记、RSS提要及其他常嵌入网页的半结构化格式。这意味着发布者无需彻底重建其内容基础设施。
数据处理与存储:NLWeb包含工具,用于将这些结构化数据添加至向量数据库,从而实现高效语义搜索与检索。系统支持各类主流向量数据库,允许开发者根据自身技术需求与规模选择合适方案。
人工智能增强层:随后,LLMs借助外部知识与上下文增强这些存储数据。例如,当用户查询餐厅相关信息时,系统自动结合矢量化内容与LLM能力,叠加地理位置洞察、评论及相关信息,以提供全面智能响应,而非简单数据检索。
通用接口创建:最终形成一个自然语言接口,既服务于人类用户又服务于人工智能代理。访客可用英语提问并获对话式回应,而人工智能系统可通过MCP框架编程访问与查询站点信息。此方法让任何网站均可参与新兴自主网络,而无需大幅技术改造。它让人工智能驱动搜索与交互变得如互联网初期创建基础网页般简易。
人工智能协议格局的涌现为企业带来众多选择
人工智能领域涌现出众多不同协议,它们的功能并非完全一致。人工智能协议格局的涌现为企业带来众多选择。例如,Google的代理到代理(Agent2Agent)旨在实现代理间交流。其重点在于协调与沟通自主人工智能,并未特别聚焦于使现有网站或人工智能内容具备人工智能功能。
Maria Gorskikh,AIA创始人兼首席执行官,也是MIT Project NANDA团队成员,向VentureBeat表示,Google的A2A通过定义模式与生命周期模型实现代理间结构化任务传递。“尽管该协议在设计上开源且模型无关,但其现有实现与工具紧密依托Google Gemini堆栈——使其更似后端协调框架,而非通用web服务接口,”她说。
另一项新兴努力是LLMs.txt。其目的在于助LLMs更好访问web内容。虽然表面看来,它似乎与NLWeb有些相似,但其实并非如此。“NLWeb与LLMs.txt并不冲突;它更像是试图从网站推断意图的web爬虫工具,”Constellation Research副总裁兼首席分析师Michael Ni向VentureBeat表示。
另一项新兴努力是LLMs.txt。其目的在于助LLMs更好访问web内容。虽然表面看来,它似乎与NLWeb有些相似,但其实并非如此。Dappier联合创始人兼首席技术官Krish Arvapally向VentureBeat表示,LLMs.txt提供一种带训练权限的markdown样式格式,助LLM爬虫适当抓取内容。NLWeb则着重于在发布者网站直接启用实时交互。
Dappier有自有平台,可自动抓取RSS提要及其他结构化数据,然后交付品牌化、可嵌入的对话界面。发布者可将其内容分发至自有数据市场。
MCP是另一重要协议,并逐渐成为NLWeb的事实标准与基础要素。从根本上说,MCP是连接人工智能系统与数据源的开放标准。Ni解释道,微软认为MCP是传输层,MCP与NLWeb共同构成开放自主网络的HTML与TCP/IP。
Forrester高级分析师Will McKeon-White指出NLWeb较其他选项有诸多优势。“NLWeb主要优势在于人工智能系统对网站组成部分的‘观察’更具可控性,从而降低系统因误读网站内容而犯错的风险,以及减少界面重构工作,”McKeon-White向VentureBeat表示。
早期采用者对NLWeb在企业自主网络中的潜力充满期待。微软不仅在Build 2025大会上推出NLWeb,还积极寻求实际应用。微软已有多个组织参与并采用NLWeb,包括芝加哥公共媒体、Allrecipes、Eventbrite、Hearst(Delish)、O’Reilly Media、Tripadvisor和Shopify。
O’Reilly Media首席技术官Andrew Odewahn是早期采用者之一,他对NLWeb充满期待。“NLWeb利用过去十年开放网络上的最佳实践与标准,并将其赋予LLMs,”Odewahn向VentureBeat表示,“企业长期致力于优化此类元数据以用于SEO及其他营销目的,但现在他们可借助NLWeb利用这些丰富数据,让内部人工智能更智能、更强大。”
在他看来,NLWeb对企业作为公共信息消费者或私人信息发布者都有价值。他指出,几乎每家公司都有销售与营销活动,可能会问‘这家公司做什么?’或者‘这个产品是什么?’
“NLWeb提供一种很好的方式,向内部LLMs开放这些信息,这样你就不必四处搜寻了,”Odewahn说。“作为发布者,你可以用schema.org标准添加自有元数据,并用NLWeb作为内部MCP服务器,供内部使用。”
这并非一项艰巨任务。Odewahn指出,很多组织可能已在使用NLWeb所依赖的多项标准。
“NLWeb提供一种很好的方式,向内部LLMs开放这些信息,这样你就不必四处搜寻了,”Odewahn说。“作为发布者,你可以用schema.org标准添加自有元数据,并用NLWeb作为内部MCP服务器,供内部使用。”
“因此现在尝试毫无风险,因为NLWeb可在你的基础设施内完全运行,”他说。“这是开源软件与优质开源数据的结合,所以你并无损失,还能从中获益。”
“NLWeb提供一种很好的方式,向内部LLMs开放这些信息,这样你就不必四处搜寻了,”Odewahn说。“作为发布者,你可以用schema.org标准添加自有元数据,并用NLWeb作为内部MCP服务器,供内部使用。”
企业应立即采用NLWeb还是等待?
Constellation Research分析师Michael Ni对NLWeb持积极态度,但这并不意味着企业需要立刻采用它。Ni指出,NLWeb正处于早期成熟阶段,企业应预计2-3年内会有实质性采纳。他建议领先企业如有特定需求,比如活跃市场,可试点并参与塑造标准。
“这是一项具有明确潜力的愿景规范,但在达到主流企业试点前,它需要生态系统验证、实施工具及参考集成,”Ni表示。
其他人对采纳持更为激进的观点。Gorskikh建议采取加速策略,确保企业不落后。
“如果你是一家拥有大量内容表面、内部知识库或结构化数据的企业,现在试点NLWeb是一项明智且必要的步骤,以保持领先,”她说。“这不是观望时刻——更像是早期采用API或移动应用。”
不过,她指出受监管行业需谨慎行事。保险、银行和医疗等领域的公司应在中立、去中心化的验证与发现系统到位前避免生产使用。已有早期努力解决这一问题——例如Gorskikh参与的MIT NANDA项目,该项目正在构建开放、去中心化的自主服务注册与声誉系统。
这对企业人工智能领导者意味着什么?
对企业的AI领导者来说,NLWeb是一个里程碑式的时刻,也是一个不应忽视的技术。人工智能将与您的网站互动,您需要为其赋能人工智能。
NLWeb是一种特别吸引出版商的方式,就像RSS在2000年代初成为所有网站必备工具一样。几年后,用户将期望它存在;他们将期望能够搜索和找到内容,而自主人工智能系统也需要能够访问这些内容。这就是NLWeb的承诺。
每日商业案例深度解读,尽在VB Daily
如果您想给老板留下深刻印象,VB Daily可以帮您。我们为您提供公司如何使用生成式人工智能的内幕消息,从监管变化到实际部署,以便您分享见解以实现最大ROI。立即订阅阅读。
我们的隐私政策
感谢订阅。查看更多VB新闻简报。
发生错误。
(以上内容均由Ai生成)