AI

思考机器实验室攻克AI输出不确定性,大模型首现完全一致结果

发布时间:2025年9月11日    来源:szf
思考机器实验室攻克AI输出不确定性,大模型首现完全一致结果

快速阅读: 前OpenAI首席技术官Mira Murati创立的Thinking Machines Lab实现大语言模型推理过程完全确定性输出,解决AI行业模型输出不确定性难题,提升金融风控、医疗诊断等领域应用质量。

前OpenAI首席技术官Mira Murati创立的Thinking Machines Lab近日宣布了一项重要技术突破,成功解决了长期困扰AI行业的模型输出不确定性问题。该实验室在最新发布的研究报告中表示,他们已经实现了大语言模型推理过程的完全确定性输出。

研究报告《在LLM推理中战胜不确定性》指出,即便在温度参数设为0的情况下,传统的大语言模型仍可能对相同的输入产生不同的输出。研究团队通过深入分析,发现了导致这一现象的两个主要原因,并提出了有效的解决方案。

首先,浮点数加法的非结合性问题在GPU并行计算环境中尤为明显,(a + b) + c与a + (b + c)的计算结果可能存在细微差异,这些差异在复杂的神经网络中会被逐层放大。其次,更为关键的是,不同的批量大小、序列长度及KV缓存状态会导致GPU内核选择策略的变化,从而改变计算执行顺序,最终引起输出结果的差异。

针对这一技术挑战,Thinking Machines Lab提出了一种batch-invariant解决方案,确保所有关键计算核在处理不同批量大小或序列分割时,能保持相同的计算顺序和结果。研究团队还针对RMSNorm、矩阵乘法和注意力机制等具体计算模块提供了详细的优化方法。

为了验证技术方案的有效性,研究团队使用了拥有2350亿参数的Qwen3-235B-A22B-Instruct-2507模型进行了实验。经过1000次重复测试,该模型在相同输入条件下实现了100%的输出一致性,这在大语言模型发展史上尚属首次。

业界专家认为,这一技术突破对于企业级AI应用具有重大意义。金融风控、医疗诊断、法律文书审核等对准确性和一致性要求极高的领域将直接受益于这项技术进步。

Thinking Machines Lab以开放研究的形式发布了这一成果,为全球AI开发者提供了新的技术参考方向。该研究不仅解决了模型输出的可预测性问题,也为AI系统从实验工具向生产工具的转型奠定了技术基础。

据了解,Thinking Machines Lab成立于2023年,专注于AI基础技术研究。该实验室此前已获得20亿美元的种子轮融资,并计划在未来几个月内推出首款产品。

这项技术突破标志着AI行业正从追求模型规模转向追求应用质量的发展阶段。随着确定性输出技术的推广应用,AI系统的可靠性和实用性有望得到显著提升。

官方研究报告链接:https://thinkingmachines.ai/blog/defeating-nondeterminism-in-llm-inference/

(以上内容均由Ai生成)

你可能还想读

亚马逊推Alexa+迈入全代理AI时代

亚马逊推Alexa+迈入全代理AI时代

快速阅读: 据外媒报道,亚马逊推出新一代智能体AI系统Alexa+,中兴与字节跳动联合研发全球首款全智能体AI手机,该技术正加速渗透医疗健康领域,可自主执行复杂任务并提升服务效率。 近日,全球人工智能领域加速向“智能体”(agentic A […]

发布时间:2025年12月8日
网传普京持《薄伽梵歌》照片系AI生成

网传普京持《薄伽梵歌》照片系AI生成

快速阅读: 据媒体报道,近日网传普京在专机手持《薄伽梵歌》的照片系AI合成,经事实核查机构BOOM验证含谷歌SynthID水印,该虚假图像由屡传不实信息的账号首发,旨在制造地缘政治误导。 近日,一张据称显示俄罗斯总统普京在专机上手持《薄伽梵 […]

发布时间:2025年12月8日
AMD锐龙7 9850X3D泄露:单核加速达5.6GHz

AMD锐龙7 9850X3D泄露:单核加速达5.6GHz

快速阅读: 据最新消息,AMD Ryzen 7 9850X3D工程样品在多款主板上运行稳定,单核频率近5.6GHz,Zen 5架构优化显著,平台兼容性良好,有望近期发布。 近日,有关AMD即将推出的Ryzen 7 9850X3D处理器的最新 […]

发布时间:2025年12月8日
英特尔BMG-G31显卡即将发布

英特尔BMG-G31显卡即将发布

快速阅读: 据最新消息,英特尔将BMG-G31显卡纳入软件支持体系,该芯片配备32个Xe2核心与16GB显存,预计2026年初以Arc B770命名亮相,旨在强化中高端GPU市场竞争力。 英特尔公司近日正式将代号为“Big Battlema […]

发布时间:2025年12月8日
戴尔Pro笔记本:AI时代企业首选

戴尔Pro笔记本:AI时代企业首选

快速阅读: 据国际数据公司(IDC)报道,戴尔推出Dell Pro系列AI商用笔记本,搭载NPU与Windows 11 Copilot+,支持长效续航、军工级耐用性及本地AI安全防护,助力企业提升效率并降低长期更新成本。 随着2025年接近 […]

发布时间:2025年12月8日
英伟达4B小模型登顶ARC评测,成本仅GPT-5 Pro的136

英伟达4B小模型登顶ARC评测,成本仅GPT-5 Pro的136

快速阅读: 12月8日消息,英伟达推出4B参数小模型NVARC,在ARC-AGI2评测中以27.64%准确率超越GPT-5Pro,单任务推理成本仅0.2美元,凭借零预训练策略和合成数据实现高效低成本部署。 近日,英伟达研发的4B参数小模型N […]

发布时间:2025年12月8日
Meta收购Limitless加码AI可穿戴设备

Meta收购Limitless加码AI可穿戴设备

快速阅读: 据最新消息,Meta收购AI可穿戴设备公司Limitless,后者以无屏幕智能吊坠著称,具备语音交互与实时转录功能;收购后团队并入Meta,专注AI硬件研发,现有产品将停售但提供一年技术支持。 日前,美国科技企业Meta宣布收购 […]

发布时间:2025年12月8日
沐曦股份科创板申购中签率公布

沐曦股份科创板申购中签率公布

快速阅读: 12月8日消息,沐曦集成电路科创板IPO网上申购户数达517.52万户,启动回拨后最终中签率升至0.03348913%,拟募资39.04亿元用于高性能GPU研发及产业化。 12月8日,国产GPU企业沐曦集成电路(上海)股份有限公 […]

发布时间:2025年12月8日