AI

AI工厂加速智能系统发展,自改进应用引领未来

发布时间:2025年10月11日    来源:szf
AI工厂加速智能系统发展,自改进应用引领未来

快速阅读: AI原生应用发展迅猛,推动AI工厂建设,以满足其对高效计算、存储和网络的需求。Together Computer CEO Vipul Prakash指出,AI应用增长速度远超传统SaaS,对基础设施提出更高要求。

AI原生计算正在重新定义进步的方式——将数年的开发周期压缩至几天,加速了智能系统的发展,这些系统能够学习、适应并进化。推动这一浪潮的是AI工厂:现代计算的动力站。这些专为数据处理设计的数据中心不仅追求性能优化,还在规模、能效和架构设计上改写规则,以支持新一代自改进的AI原生应用。随着创新周期缩短,问题不再是基础设施能否跟上步伐,而是它能多快地自我革新。

Together Computer的联合创始人兼首席执行官Vipul Prakash讨论了AI原生应用与AI工厂之间的关系。“当SaaS应用快速增长时……它们可能在九个月内翻倍,”Prakash说,“这被认为是极快的增长速度。现在我们看到AI原生应用在九天内就能实现这样的增长。我们的客户扩展速度非常快,他们的产品极具吸引力,并在全球范围内推广,这导致了对高效AI计算的巨大需求。”

Prakash在接受theCUBE的John Furrier采访时,于theCUBE + NYSE Wired: AI Factories – Data Centers of the Future活动期间,讨论了AI原生应用的爆炸性增长、所需的支持基础设施以及企业在构建自己的AI工厂中的新兴角色。

AI原生应用是指其核心功能由AI模型驱动的应用,Prakash解释道。与后期添加AI特性的传统应用不同,这类应用依赖模型本身存在。例如ChatGPT、Cursor和用于视频生成的Hedra。“这与在传统应用中引入一些AI特性不同,因为AI在这里处于核心地位,”他说,“它们对效率、规模和底层AI基础设施增长的要求极为苛刻,真正推动了快速建设这些消耗大量数据以学习并高效生产的AI工厂的需求。”

支持AI原生应用需要专门的基础设施——AI工厂,这些设施需具备大规模吞吐能力和计算、存储及网络的持续可用性。随着企业扩大AI项目规模,许多企业开始转向开源模型,利用自有数据微调这些模型,创建出媲美闭源方案的定制高性能解决方案,Prakash指出。“一旦拥有数百万用户,就会收集到大量数据和成功标准,”他说,“这些数据是微调开源模型的宝贵资源。我们看到的情况是,应用使用闭源API,但会将流量分割,部分流量通过自建或改编的开源模型处理,这些模型通过Together实现大规模部署。”

最大的基础设施挑战之一是数据传输。AI系统要求数据靠近计算资源,以便在训练、微调和推理过程中快速访问。Together AI通过构建与模型紧密相连的大规模存储系统来解决这一问题,确保最低延迟,Prakash提到。“我们有机器人模型的实体系统,这些模型具有相当大的初始数据集和生成数据集,”他说,“未来几年,我们将看到AI工厂配备大量的存储空间。”

以下是完整的视频采访,这是SiliconANGLE和theCUBE对theCUBE + NYSE Wired: AI Factories – Data Centers of the Future活动报道的一部分。

由技术远见者约翰·富里尔和戴夫·韦兰特创立,SiliconANGLE Media 已构建了一个涵盖行业领先的数字媒体品牌的动态生态系统,覆盖超过1500万高端技术专业人士。我们新推出的专有产品 theCUBE AI Video Cloud 正在观众互动领域取得突破,利用 theCUBEai.com 的神经网络帮助技术公司做出数据驱动的决策,保持在行业对话的前沿。

(以上内容均由Ai生成)

你可能还想读

英伟达4B小模型登顶ARC评测,成本仅GPT-5 Pro的136

英伟达4B小模型登顶ARC评测,成本仅GPT-5 Pro的136

快速阅读: 12月8日消息,英伟达推出4B参数小模型NVARC,在ARC-AGI2评测中以27.64%准确率超越GPT-5Pro,单任务推理成本仅0.2美元,凭借零预训练策略和合成数据实现高效低成本部署。 近日,英伟达研发的4B参数小模型N […]

发布时间:2025年12月8日
Meta收购Limitless加码AI可穿戴设备

Meta收购Limitless加码AI可穿戴设备

快速阅读: 据最新消息,Meta收购AI可穿戴设备公司Limitless,后者以无屏幕智能吊坠著称,具备语音交互与实时转录功能;收购后团队并入Meta,专注AI硬件研发,现有产品将停售但提供一年技术支持。 日前,美国科技企业Meta宣布收购 […]

发布时间:2025年12月8日
沐曦股份科创板申购中签率公布

沐曦股份科创板申购中签率公布

快速阅读: 12月8日消息,沐曦集成电路科创板IPO网上申购户数达517.52万户,启动回拨后最终中签率升至0.03348913%,拟募资39.04亿元用于高性能GPU研发及产业化。 12月8日,国产GPU企业沐曦集成电路(上海)股份有限公 […]

发布时间:2025年12月8日
阿里推Qwen3-TTS:49音色10语9方言,WER碾压商用模型

阿里推Qwen3-TTS:49音色10语9方言,WER碾压商用模型

快速阅读: 12月8日消息,阿里巴巴推出通义千问Qwen3-TTS语音合成模型,支持49种音色、10种语言及9种方言,免费开放每月百万字符额度,并在上海120所中小学试点教育应用。 今日,阿里巴巴正式推出通义千问Qwen3系列新成员——Qw […]

发布时间:2025年12月8日
京东云JoyBuilder千卡训练提速3.5倍

京东云JoyBuilder千卡训练提速3.5倍

快速阅读: 12月8日消息,京东云JoyBuilder平台完成关键升级,支持GR00T N1.5千卡训练,兼容LeRobot框架,训练效率提升3.5倍,亿级数据训练从15小时缩短至22分钟。 日前,京东云JoyBuilder模型开发平台完成 […]

发布时间:2025年12月8日
麦肯锡:AI将取代8亿岗位,同时创造新机遇

麦肯锡:AI将取代8亿岗位,同时创造新机遇

快速阅读: 据麦肯锡全球研究院消息,到2030年全球或有8亿岗位被人工智能取代,同时创造1.3亿至2.3亿新岗位,冲击驾驶、物流、医疗、法律等多个行业,专家呼吁加强再培训与政策应对。 日前,人工智能技术快速发展引发全球关注。加州大学伯克利分 […]

发布时间:2025年12月8日
可灵AI上线主体库,角色跨场景“永不变脸”

可灵AI上线主体库,角色跨场景“永不变脸”

快速阅读: 12月8日消息,快手旗下可灵AI发布“主体库”,为O1视频模型新增长期记忆能力,用户上传单图即可跨场景调用一致角色,主体一致性超96%,并推分级服务与2025年多人功能规划。 今日,快手旗下可灵AI正式发布“主体库”(Subje […]

发布时间:2025年12月8日
n1n.ai 重塑大模型API成本与体验

n1n.ai 重塑大模型API成本与体验

快速阅读: 据最新消息,大模型API平台n1n.ai整合近500种开源与闭源模型,价格低至官方十分之一,响应快、稳定性高,已助企业降本超70%并提升用户满意度。 近日,大模型API服务平台n1n.ai凭借高性价比、高稳定性及丰富模型选择,正 […]

发布时间:2025年12月8日