Red Hat 和 Samsung 扩展了 AI 和内存集成

发布时间:2025年5月20日    来源:szf
Red Hat 和 Samsung 扩展了 AI 和内存集成

快速阅读: 《硅角度》消息,红帽公司与三星合作优化AI和内存技术,解决数据访问和系统兼容性问题。通过开源创新和工程策略,红帽助力AI模型获取机构知识并实现无缝集成,为企业提供稳定可靠的AI基础设施解决方案。

寻求将人工智能基础设施从实验室实验推向生产就绪解决方案的企业面临一个熟悉的瓶颈:数据访问、系统兼容性和规模化性能。红帽公司正通过与硬件和芯片合作伙伴的协作解决这一难题,最近与三星电子合作,以优化实际企业环境中的人工智能和内存技术。红帽公司首席技术官办公室副总裁兼杰出工程师斯蒂芬·瓦特(如图所示)与theCUBE讨论了公司的开源创新及与三星的合作。“我认为这一切都始于大型语言模型,”斯蒂芬·瓦特表示。“我认为我们曾经历过预测性人工智能的时代,现在随着生成式人工智能的兴起,在训练、微调和推理这三个领域有许多新的应用场景和有趣的用例。去年,我们推出了InstructLab,实现了微调模型的普及化。通过我们的Neural Magic收购,我们在推理方面有了更多投入,这涉及服务模型并在企业中为应用程序创造价值。”

瓦特在红帽峰会上与theCUBE研究的罗布·斯特雷查伊和theCUBE主持人丽贝卡·奈特进行了交谈,这是SiliconANGLE媒体直播工作室theCUBE独家广播的一部分。他们讨论了红帽不断发展的AI基础设施战略、开源创新及其与三星的合作。(* 披露:theCUBE是红帽峰会的付费媒体协办方。红帽公司,作为theCUBE活动报道的主要赞助方,以及其他赞助商均不对theCUBE或SiliconANGLE的内容拥有编辑权。)

照片来源:硅立方

在上下文中扩展AI基础设施并保持控制

红帽与三星的合作重点是实现参考架构之间的兼容性,以支持新兴的Compute Express Link内存市场。根据瓦特的说法,目标是在混合基础设施中创建一个生态系统,使企业在性能和延迟要求使数据本地化至关重要的情况下能够放心地部署AI工作负载。“我认为这都与上下文有关,”他说。“有检索、增强、[检索增强生成],然后是[Kafka] Raft,它应用RAG进行微调。我们在上游Llama Stack项目中有一个新兴的故事,我们刚刚做了很多工作来启用所有这些功能。”

随着人工智能在边缘、数据中心和云环境中的扩展,红帽正凭借其分布式系统的专长来控制推理扩散。据瓦特所述,该公司优先采用的工程策略旨在让机构知识更易于被AI模型获取,并探索新的架构模式以实现无缝的模型集成。“我认为再次回到上下文,有两个特定的领域,”他说。“一个是向量数据库。你把这些[提取、转换、加载]管道中的文档分块并放入那些向量数据库中。一旦这样做,你就能够基本上将组织内部的知识添加到可以从大型语言模型中访问的内容中。另一个非常有趣的是面向服务架构的演进……将其与大型语言模型对接——我认为这两者结合起来非常令人兴奋。”

开源仍是红帽处理AI基础设施方法的核心。根据瓦特的说法,随着模型开发和AI部署的创新加速,该公司继续投资于支持透明、信任和长期可行性的发展社区。“创新的速度、新项目的涌现、正在发生的颠覆性创新……我们的角色就是构建一条稳定的软件供应链,让企业能够使用已稳定且安全的软件,”他说。

以下是完整的视频访谈,这是SiliconANGLE和theCUBE对红帽峰会报道的一部分:

(* 披露:theCUBE是红帽峰会的付费媒体协办方。红帽公司,作为theCUBE活动报道的主要赞助方,以及其他赞助商均不对theCUBE或SiliconANGLE的内容拥有编辑权。)

照片来源:硅立方

来自硅立方联合创始人约翰·弗瑞尔的一条消息:

您的支持对我们非常重要,它帮助我们保持内容免费。只需点击一下即可支持我们的使命,提供免费、深入且相关的内容。

加入我们的YouTube社区

加入包括超过15,000名#CubeAlumni专家的社区,其中包括亚马逊CEO安迪·贾西、戴尔科技创始人兼CEO迈克尔·戴尔、英特尔CEO帕特·基辛格等众多名人和专家。

“theCUBE是我们行业的重要伙伴。你们真的是我们活动的一部分,我们真的很感谢你们的参与,我知道人们也欣赏你们创造的内容。”——安迪·贾西

谢谢您!

(以上内容均由Ai生成)

关键词: AihatRedSamsung内存

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日