SambaNova 首次推出低成本、开源深度研究代理框架

发布时间:2025年3月11日    来源:szf
SambaNova 首次推出低成本、开源深度研究代理框架

快速阅读: 据《硅角度》最新报道,人工智能芯片创业公司桑巴瓦纳系统今日宣布开发了一种新框架,支持“深度研究”的AI,比现有系统快三倍且成本更低。该框架使用桑巴瓦纳的人工智能加速器而非英伟达GPU,能安全分析私密数据。此外,桑巴瓦纳称其开源模型降低了费用,为企业节省大量成本。

人工智能芯片创业公司桑巴瓦纳系统公司今日宣布,已开发出一种新的框架,用于支持“深度研究”的人工智能。这种框架比现有专注于研究的系统快三倍,并且成本更低。该公司在一篇博客文章中表示,它与人工智能代理开发商克鲁人工智能公司合作创建了这个新框架,使公司能够开发能在完全安全方式下分析其最私密数据的深度研究代理。当然,这些研究代理不会依赖于英伟达的图形处理单元,而是使用桑巴瓦纳的替代人工智能加速器,该公司称这些加速器提供了更多动力并且成本更低。

桑巴瓦纳获得了超过10亿美元的风险投资,是英伟达的竞争对手,开发适用于人工智能模型的训练和推理的高性能计算机芯片。这些芯片可通过云端访问,也可通过公司提供的设备进行本地部署。公司可以选择在桑巴瓦纳云上运行深度研究,该公司称这将比任何基于GPU的代理快三倍。或者,如果他们拥有桑巴瓦纳的一些强大的SN40L处理器,他们可在内部完成所有工作。这些代理是使用开源大型语言模型构建的,如Meta平台公司的Llama 3.3 70B或深寻有限公司的R1,这进一步有助于降低成本。

桑巴瓦纳解释说,现有的基于人工智能的深度研究解决方案非常昂贵,因为它们需要的传统聊天应用所需的令牌数量的十倍甚至百倍。此外,公司表示,这样的工具并不总是像其创造者宣称的那样快速。人工智能代理路由桑巴瓦纳深度研究框架的关键组成部分之一是其自主路由器,它可以规划并路由请求到最有能力的代理,以返回最准确的结果。默认情况下,该框架包含三个代理——一个通用搜索代理、一个深度研究代理和一个财务分析师,但公司可自由添加自己的人工智能代理并与自己的私人数据源连接。

该公司举了一个金融交易员希望生成关于最新市场趋势的报告的例子。首先,该交易员可能会输入查询,例如“总结亚马逊最新的市场新闻”。这将首先发送给通用代理,该代理可能会使用大约三个搜索查询找到所有最新的新闻,成本约为1000个令牌。一旦交易员获得基本信息,他们可能想深入挖掘并要求生成“亚马逊的财务分析”。在这种情况下,查询将被路由到财务分析师代理,该代理将进行更深入的研究。它提供了更多细节,因此可能使用大约15个提示来挖掘所有所需的信息,使用的令牌数量增加到约20倍。基于这一更深入的分析,交易员可能希望生成一份更全面的报告,总结并引用来自各种文章的发现。在这种情况下,深度研究代理开始发挥作用,从数百个来源收集信息以生成最终报告,然后清理并提交给交易员。桑巴瓦纳表示,这可能需要高达50,000个令牌。该公司强调,每个步骤都将是“闪电般迅速”,在几秒钟内完成,而不是类似基于人工智能的研究系统可能需要的几分钟。此外,由于用户仍在循环中,他们可确保令牌不会浪费在不准确的报告上。

开源模型降低费用

这是因为研究过程中使用了大量的令牌,费用是用户的主要担忧。这就是为什么桑巴瓦纳只依赖开源大型语言模型的原因,该公司指出这些开源模型比专有替代方案更实惠。该公司表示,其节省的成本可以迅速累积。例如,对于一家拥有200名员工的公司,每位员工每天执行20次平均使用20,000个令牌的深度研究查询,这意味着每天总共会有8000万个令牌。桑巴瓦纳表示,通过在桑巴瓦纳上使用Llama 3.3,而不是运行OpenAI的GPT-4,这样的公司在一年内可以节省超过100万美元。

桑巴瓦纳的深度研究框架的演示可供公司试用,而希望将其与其自身数据集成的企业可以从克隆GitHub仓库开始。

图片:桑巴瓦纳

约翰·弗瑞尔(John Furrier),硅巷联合创始人的一条消息:

您的支持对我们非常重要,它帮助我们保持内容免费。只需点击一下即可支持我们提供免费、深入和相关的内容的使命。加入我们的YouTube社区

加入包括亚马逊首席执行官安迪·贾西、戴尔科技创始人兼首席执行官迈克尔·戴尔、英特尔首席执行官帕特·格尔辛格等在内的超过15,000名#CubeAlumni专家的社区。

“立方体是业界的重要合作伙伴。你们真的是我们活动的一部分,我们真的很感谢你们的到来,我知道人们也很欣赏你们创造的内容。”

——安迪·贾西

(以上内容均由Ai生成)

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日