Microsoft 的新 Phi-4 AI 模型在小封装中集成了强大的性能

发布时间:2025年2月27日    来源:szf
Microsoft 的新 Phi-4 AI 模型在小封装中集成了强大的性能

快速阅读: 据《VentureBeat 公司》最新报道,微软发布了新型AI模型菲-4,包括多模态和迷你版本,能在较小计算能力下处理文本、图像和语音。菲-4多模态在多项任务中表现优异,而迷你版在数学和编码任务上与更大模型相当。这些模型提高了效率和普及性,适用于标准设备和边缘计算,降低了成本并提升了隐私保护。订阅通讯获取更多信息。

加入我们的每日和每周通讯,获取行业领先的人工智能报道的最新更新和独家内容。了解微软公司推出了一类新的高效人工智能模型,这些模型能够同时处理文本、图像和语音,且所需计算能力远低于现有系统。今天发布的菲-4模型代表了小型语言模型(SLM)开发的一个突破,提供了此前仅由更大规模人工智能系统才能实现的功能。菲-4多模态,一个拥有56亿参数的模型,以及菲-4迷你,一个拥有38亿参数的模型,在某些任务上表现优于同样大小的竞争对手,甚至在某些任务上与规模是其两倍的模型性能相当,根据微软公司的技术报告显示。

“这些模型旨在为开发者提供先进的AI功能,”微软公司生成式AI副总裁魏朱·陈表示。“菲-4多模态能够同时处理语音、视觉和文本输入,为创建创新和情境感知的应用程序打开了新的可能性。”

这一技术成就出现在企业越来越多地寻求能够在标准硬件或“边缘计算”——直接在设备上而非云数据中心运行的AI模型之时,以降低成本并减少延迟,同时保持数据隐私。微软公司如何构建了一个无所不能的小型AI模型菲-4多模态的独特之处在于其新颖的“LoRA混合技术”,使其能够在单一模型中处理文本、图像和语音输入。“通过利用LoRA混合技术,菲-4多模态扩展了多模态能力,同时最小化了不同模式之间的干扰,”研究论文指出。“这种方法实现了无缝集成,并确保了涉及文本、图像和语音/音频的任务中的一致性能。”

这种创新使得模型能够在不降低性能的情况下,维持强大的语言能力,并添加视觉和语音识别功能。该模型在Hugging Face OpenASR排行榜上以6.14%的词错误率位居榜首,超过了专门的语音识别系统如WhisperV3。它还在涉及数学和科学推理的视觉任务中表现出竞争力。

紧凑的AI,巨大的影响:菲-4迷你设定新的性能标准

尽管体积小巧,菲-4迷你在基于文本的任务中展示了卓越的能力。微软公司报告称,该模型“在各种语言理解基准测试中超越了同等大小的模型,并与规模大一倍的模型持平”。特别值得注意的是该模型在数学和编码任务上的表现。根据研究论文,“菲-4迷你由32个带有3072隐藏状态大小的Transformer层组成”,并结合了组查询注意力以优化长上下文生成的内存使用。在GSM-8K数学基准测试中,菲-4迷你获得了88.6%的分数,超过了大多数80亿参数模型,而在MATH基准测试中达到了64%,显著高于同类大小的竞争者。

“对于数学基准测试,该模型以显著优势超越了同等大小的模型,有时超过20分。它甚至超越了规模大一倍的模型的成绩,”技术报告指出。

变革性部署:菲-4的实际效率

容量,一个人工智能答案引擎,已经利用菲系列来提升其平台的效率和准确性。容量的产品负责人史蒂夫·弗雷德里克森在一份声明中表示:“从最初的实验来看,真正让我们印象深刻的是菲的准确性和部署的简便性,即使在定制之前也是如此。自那以后,我们能够提高准确性和可靠性,同时保持我们一开始就重视的成本效益和可扩展性。”

容量报告称,与竞争工作流程相比,成本节省了4.2倍,同时实现了相同的或更好的定性结果用于预处理任务。

无界限的AI:微软公司的菲-4模型将高级智能带入任何地方

多年来,人工智能的发展一直遵循着一个单一的理念:越大越好。更多的参数,更大的模型,更高的计算需求。但微软公司的菲-4模型挑战了这一假设,证明了力量不仅关乎规模,更关乎效率。菲-4多模态和菲-4迷你不是为了科技巨头的数据中心,而是为了现实世界——在那里计算能力有限,隐私问题至关重要,AI需要在没有持续连接到云端的情况下无缝工作。

这些模型虽小,却具有重要意义。菲-4多模态将语音、视觉和文本处理整合到一个系统中而不牺牲准确性,而菲-4迷你则在数学、编码和推理性能方面与规模大一倍的模型相匹敌。这不仅仅是让AI更加高效的问题;更是让它更加普及的问题。

微软公司将菲-4定位为广泛采用的对象,通过Azure AI工厂、Hugging Face和Nvidia API目录提供。目标很明确:AI不应该被昂贵的硬件或庞大的基础设施所限制,而是可以在标准设备上运行,在网络边缘运行,并在计算能力稀缺的行业中运行。日本AI公司Headwaters Co., Ltd.的董事西岛正也亲眼见证了这一影响。“边缘AI即使在网络连接不稳定或保密性至关重要的环境中也表现出色,”他在一份声明中说。这意味着AI可以在工厂、医院、自动驾驶汽车等地方发挥作用——这些地方需要实时智能,而传统的基于云的模型往往无法满足需求。

从根本上讲,菲-4代表了一种思维方式的转变。AI不仅仅是为了那些拥有最大服务器和最深口袋的人的工具。如果设计得当,它可以适用于任何地方,为任何人服务。菲-4最革命性的地方不在于它可以做什么,而在于它可以在哪里做。

每日商业用例洞见

如果你想给老板留下深刻印象,VB每日可以帮到你。我们为你提供有关公司如何使用生成式AI的内部消息,从监管变化到实际部署,以便你可以分享见解以获得最大的投资回报。现在订阅查看我们的隐私政策。

(以上内容均由Ai生成)

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日