数据分析加速如何解决 AI 的隐藏瓶颈

发布时间:2025年4月26日    来源:szf
数据分析加速如何解决 AI 的隐藏瓶颈

快速阅读: 据《福布斯》称,AI热潮背后,企业面临数据准备瓶颈。神经刀等初创公司通过专用硬件加速数据分析,降低运营成本和能耗。AI与分析融合推动实时决策,专用分析处理器或成新趋势。

人工智能的炒作容易让人盲目跟风。但在幕后,大多数企业团队正在与缓慢的流程和数据准备瓶颈作斗争。盖蒂人工智能这个世界从不缺乏头条新闻。例如,去年11月,塞雷布拉斯公司声称已经打造出全球最快的AI推理芯片。今年4月,OpenAI推出了所谓的下一代‘巨型’且‘昂贵’的模型,感觉像是在与一个深思熟虑的人交谈。然而,在喧嚣之下,企业团队内部正发生着一些事情。

尽管不少首席执行官在大肆宣传经过微调的协作助手、多模态技术奇迹以及巨额投资,但工程师们——经常深入数据泥潭,AI在此生死攸关——正在观察他们的仪表盘:查询时间飙升,流程堵塞,模型停滞。生成式AI热潮引发了规模更大的模型竞赛,OpenAI首席执行官山姆·阿尔特曼是最直言不讳的支持者。但在炒作中,有一个隐藏的分析瓶颈正在削弱许多企业的AI雄心。

大多数组织仍在努力理解庞大的混乱数据集。尽管GPU极大地加速了模型训练,但数据准备——确保输入正确的乏味任务——仍然困于从未设计用于这种规模的CPU绑定架构。简单地说,数据量的增长速度超过了我们处理它们的能力。正如神经刀公司的首席执行官兼联合创始人埃尔德·西蒂在接受采访时指出的那样:“尽管行业长期以来依赖CPU进行数据准备,但它们已成为瓶颈——消耗了超过30%的AI管道。”

更多内容…

《纽约时报》迷你填字游戏答案(4月26日星期六)

谷歌泄露的新订阅变化揭示了Gemini AI的最新动态

谷歌紧急发布Chrome安全更新——立即行动结果?

流程迟缓,成本膨胀,并且AI抱负与实际投资回报率之间出现了越来越大的差距。西蒂解释说,这种压力触发了一场重大的心态转变,因为行业现在积极寻求解决方案。

“它推动了一场无声的革命,重塑了数据分析——从人为驱动的洞察力转向AI模型消费和处理不断增长的数据集,从而推动数据收集和处理的加速循环,”他说。西蒂共同创立的以色列半导体初创公司神经刀认为,答案在于专门设计用于加速数据分析的新硬件类别。他们的分析加速器不仅仅是更快的CPU——这是一种从根本上不同的架构,专门构建来处理现代数据库工作负载。

但这能否有意义地重塑企业AI的经济性?为什么数据准备正在减缓AI企业发现AI中的瓶颈并不总是出现在模型中,而是在数据本身上游。正如普拉格马蒂克研究所的一份报告显示的,“数据从业者花费80%的宝贵时间寻找、清理和整理数据。”

虽然对数据科学家实际花在清理和准备数据上的时间估计各不相同,但行业共识是明确的:数据科学家用于数据清洗和准备的时间远远超过用于分析和建模的时间。数据准备包括提取、转换和连接大量结构化和半结构化数据,这些数据通常驻留在广阔的湖仓环境中。这是一个问题。因为大多数这项工作仍然在通用CPU上运行。

根据AMD的说法,目前市场支持大约200万个用于分析工作的CPU插槽数量——预计到2027年将增长到400万至500万个。这是大量的通用硬件在运行并非设计为以PB级规模运行的查询。“公司正在传统CPU扩展方面遇到瓶颈,”西蒂解释道。“我们看到超大规模企业和云服务提供商每年花费数十亿美元来维护其分析基础设施。但回报正在趋于平缓。”

增加更多的CPU只能走这么远,因为扩展集群会指数级增加节点间通信开销——造成性能、功率和成本障碍。超过某个点后,包括硬件、能源、数据中心空间在内的成本开始超过性能提升。这种动态在AI环境中尤其成问题,其中延迟至关重要,过时的数据可能会降低模型准确性。

专用分析处理器的兴起

神经刀的加速器通过显著提高性能和减少查询时间,释放了数据分析平台的全部潜力。通过将操作从CPU卸载到专门构建的硬件上——这一过程被称为下推——它增加了每个服务器的计算能力,使与仅使用CPU部署相比,可以更小的集群更快地处理大型数据集。

专用分析处理器的兴起

“通用CPU无法足够快地扩展以满足日益增长的性能需求和数据量,这迫使组织扩大集群规模,”西蒂指出。“专门构建的硬件通过增强每个服务器的计算能力来支持分析,减少了对大规模集群的需求,并有助于规避网络开销、电源限制及操作复杂性等瓶颈。”

在TPC-H基准测试中——这是评估决策支持系统的标准——西蒂注意到神经刀加速器比领先的向量化CPU实现(如Presto-Velox)快约4倍。神经刀的主张是,通过将分析从CPU卸载并交给专用硅片,企业可以用一小部分基础设施实现更好的性能——一次性降低运营成本、能耗及复杂度。

云玩家正在关注这种转变

这不是孤立发生的。神经刀与亚马逊云科技紧密合作,将其分析加速器集成到AWS EC2 F2实例中,使其对基于云的客户可用——特别是在金融分析或AI模型刷新等领域。

“这种向定制分析处理的转变类似于我们在AI领域的GPU崛起,”西蒂告诉我。“首先超大规模企业加入,然后更广泛的市场跟进。”

主要半导体厂商也在关注这个领域。随着Nvidia的AI加速器主导地位的增长,像Intel和AMD这样的公司正在寻找相邻计算类别的立足点。这意味着专用分析硬件可能成为下一个重要的AI战场。

AI和分析的融合

不久之前,AI和分析还在不同的系统上运行。但如今,由于称为数据湖仓的平台,公司可以使用单一数据源来驱动仪表板和机器学习模型。虽然这种设置可以提高效率,但也带来了新的风险。如果湖仓中的数据混乱或过时,它会减慢一切——从业务报告到AI性能。

传统的商业智能工具是为人设计的,通常按计划运行。另一方面,AI系统始终在线。它们需要实时、海量的数据。这就是为什么加快公司准备和处理数据的方式不再是一种选择。这对保持模型更新、见解精准并决策迅速至关重要。

“通过减少准备和查询数据所需的时间,公司可以更频繁地刷新模型,缩短反馈循环,并推动更好的实时决策,尤其是在金融、网络安全、医疗保健等行业,”西蒂解释道。

这就是为什么加快公司准备和处理数据的方式不再是一种选择。这对保持模型更新、见解精准并决策迅速至关重要。

重新思考分析基础设施

明确的是,分析加速市场仍处于早期阶段。因此,采用可能需要时间。企业在核心基础设施方面的变动较为缓慢,更换硅片从来都不是一件简单的事。但迹象已经显现:大型云集成、有希望的基准测试以及越来越多的认识表明,AI的实际价值不仅取决于模型大小,还取决于你如何高效地移动和理解数据。

“我们正处于专用计算新时代的开端,”西蒂指出。“正如GPU通过提供专用硬件来改变AI一样,分析处理器将通过解决查询执行中的特定瓶颈来改变我们处理数据的方式。”

对于那些难以将AI投资转化为可衡量的投资回报的企业来说,解决分析瓶颈或许是首个关键突破。AI的未来不会仅仅靠更大的模型赢得——而是取决于你能多有效地将恰当数据传递给它们。

(以上内容均由Ai生成)

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日