Perplexity 之谜:低比特量化如何影响 AI 精度

发布时间:2025年3月7日    来源:szf
Perplexity 之谜:低比特量化如何影响 AI 精度

快速阅读: 据《黑客 Noon》最新报道,本文研究了CherryQ在大型语言模型LLaMA2上的量化效果。实验结果显示,CherryQ在3位和4位量化下均优于其他方法,显著降低了困惑度,并在多个下游任务中取得了最高平均得分,展示了其在量化后的性能保持能力和泛化能力。该文已获CC BY 4.0许可并在arxiv网站发布。

作者:(1)崔万云,上海财经大学,同等贡献;(2)王千乐,上海财经大学,同等贡献。

1 摘要和引言
2 相关工作
3 参数对模型性能影响的量化及
4 统一混合精度训练
5 大型语言模型中参数异质性的普遍性
6 量化实验及
6.1 实施细节
6.2 基础大型语言模型的量化影响
6.3 聊天大型语言模型的量化影响
6.4 参数选择标准比较、结论与参考文献

6.2 基础大型语言模型的量化影响
在本节中,我们展示了CherryQ在LLaMA2[23]上的主要实验结果,证明了其有效性。我们使用困惑度和下游任务来评估CherryQ,并将其性能与最先进的量化方法进行比较。

6.2.1 困惑度结果
我们遵循[8, 21]的方法,在两个广泛使用的语料库C4和WikiText2[19]上评估CherryQ的困惑度。我们使用C4的验证集以避免数据泄露。表1显示了使用不同量化方法进行3位量化的结果。我们展示了不同模型规模和不同组大小的结果。从结果可以看出,CherryQ在所有模型规模(7B和13B)和分组规模(64和128)下均优于其他所有方法,并在C4和WikiText-2数据集上实现了最低的困惑度。值得注意的是,CherryQ的困惑度显著接近全精度(FP16)基线,与其他方法相比,这突显了其在量化后保持模型性能的能力。

表2比较了不同的4位量化方法。同样,CherryQ在大多数设置中获得了最低的困惑度分数,展示了其在更高位量化设置中的有效性。我们遵循[8, 21]的方法,在两个广泛使用的语料库C4和WikiText2[19]上评估CherryQ的困惑度。我们使用C4的验证集以避免数据泄露。表1显示了使用不同量化方法进行3位量化的结果。我们展示了不同模型规模和不同组大小的结果。

6.2.2 下游任务性能
为了进一步验证特定任务上的有效性,我们在HuggingFace OpenLLM排行榜上的各种下游任务中评估了量化模型。表3展示了LLaMA2的不同3位量化方法的性能对比。CherryQ几乎在所有任务上都优于其他方法,取得了最高的平均得分。这展示了CherryQ能够保持模型在面对下游任务时的泛化能力。表4扩展到4位量化比较。CherryQ继续表现出色,在大多数单个任务上取得最高分,并且总体平均得分最高。这些结果突显了CherryQ在不同量化位数和模型规模下的泛化能力。CherryQ几乎在所有任务上都优于其他方法,取得了最高的平均得分。这展示了CherryQ能够保持模型在面对下游任务时的泛化能力。

本文可在arxiv网站上以CC BY 4.0许可证发布。

(以上内容均由Ai生成)

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日