Baseten 获得 $75M 以为 AI 工作负载提供高性能推理
快速阅读: 据《硅角度》最新报道,BaseTen Labs,一家专注于高性能推理的AI初创公司,宣布完成7500万美元C轮融资,总融资额达1.35亿美元。该公司提供AI推理平台,帮助企业在云端或本地基础设施上运行大型语言模型。BaseTen的平台可优化GPU资源利用,降低成本,提升性能。目前,BaseTen已拥有超过100家企业客户,包括Patreon和Descript等。该公司表示,客户在使用其服务后,推理成本平均降低约40%。
BaseTen Labs公司,一家专注于为大型语言模型及其他人工智能应用提供高性能推理的人工智能初创企业,今天宣布完成了由IVP和Spark Capital领投的7500万美元C轮融资。此轮融资还包括Greylock、Conviction、South Park Commons、01 Advisors和Lachy Groom的参与,使公司的总融资额达到了1.35亿美元。
BaseTen构建了一个用于企业运行大型语言模型(LLM)的AI推理平台,这些模型可以在云端或者其自身的本地基础设施上运行。为了实现AI应用的扩展,它们需要访问极其快速且可靠的推理,即查询模型并计算响应的过程。然而,对于很多组织而言,这是一个挑战,因为支持推理所需的高性能图形处理单元(GPU)通常难以获取。即使是资金最充裕的企业也可能难以获取这些资源,如果无法找到足够的资源,最终会导致性能不佳的应用程序,甚至偶尔出现停机。GPU短缺也意味着需要支付更高的成本。
BaseTen并不运营自己的数据中心,而是依赖于来自亚马逊网络服务(AWS)、谷歌云和微软等提供商的公共云基础设施。通过结合这些云平台的资源,该公司表示可以更好地访问GPU。此外,客户也可以在其自身的数据中心运行该公司的软件。
BaseTen的平台提供了启动高性能推理所需的一切。这包括一个庞大的专有和开源模型库、现代化的工具和工作流程,用于部署、管理和维护LLM的生产环境,以及多集群、多云基础设施,以满足跨区域和AI模型模式扩展的需求。它还提供访问应用研究的权限,使客户可以使用最新的技术和框架来提高其AI应用程序的性能和成本效益。此外,还有专门的AI工程师协助客户部署这些应用程序。
在接受CNBC采访时,BaseTen联合创始人兼首席执行官Tuhin Srivastava表示,公司提供的主要优势之一是能够保证对GPU资源的访问。他说,虽然很多公司确实部署了自己的AI模型,但大多数公司在正确的位置获取足够GPU方面都会遇到困难。此外,客户还会因最后一刻的警告而感到沮丧,这些警告表明他们正在使用的某些GPU将进入维护模式,这意味着它们会突然变得不可用。Srivastava表示,BaseTen有足够的资源避免此类中断。“在这个市场上,你的首要差异化因素是你能多快行动,”他声称,“这是对我们客户的核心益处。”
此外,BaseTen还可以为客户节省大量资金,声称平均客户在开始使用其服务后,推理成本下降约40%,同时还能获得更好的性能。这或许解释了该公司在过去12个月中收入增长超过六倍的原因,尽管它没有提供具体的销售数字。
另一方面,该公司声称拥有超过100家企业的客户名单,其中包括众筹平台Patreon、AI初创公司Writer和视频编辑公司Descript。Srivastava表示,他的客户更重视快速将高质量的AI产品推向市场,并选择BaseTen以确保这一点。“速度、可靠性及成本效益是不可或缺的,这是我们投入100%关注的地方,”他补充道。
Spark Capital普通合伙人Will Reed表示,如果AI产品尚未遇到推理问题,那是因为它尚未实现真正的规模。“每个成功的AI项目都需要卓越的推理性能,否则没有人愿意使用它,”他解释说。“如果你押注产品的未来或公司的未来在于这种性能,选择合适的合作伙伴至关重要。”
(以上内容均由Ai生成)