标签: 量化
-
PyTorch 2.8发布:量化LLM推理性能飞跃,支持Intel GPU
快速阅读: 近日,PyTorch 发布 2.8 版本,大幅提升量化大语言模型在 Intel CPU 上的推理性能,首次支持 Intel GPU 分布式后端,优化算法提高推理速度,支持多种量化模式,增强 ROCm 支持,提供更强大的工具推动大 […]
发布时间:2025-08-08 19:55 来源:szf -
纽约市市长办公室宣布对音乐录音室进行人口普查,以量化其经济影响
快速阅读: 据《数字音乐新闻》最新报道,在纽约A2IM独立音乐周上,市府宣布将对录音室进行统计调查。录音室是创意产业核心,为推动文化发展重要引擎。调查旨在了解其数量、规模及挑战,以支持行业发展并创造更好环境。 在纽约的A2IM独立音乐周活动 […]
发布时间:2025-06-11 14:55 来源:szf -
用于量化车辆电气化能源效益的可转移车辆能耗评估框架
快速阅读: 《Nature.com》消息,本研究提出了一种普适的能量消耗评估框架,通过马尔可夫链和XGBoost等方法,量化了天津和西宁两地不同类型车辆的能耗水平。结果显示,电动车在节能减排方面表现优异。但该框架适用性有限,需进一步完善模型 […]
发布时间:2025-05-24 18:49 来源:szf -
新模型量化无人机配送网络中的网络风险
快速阅读: 据《欧亚评论》称,随着无人机配送服务快速发展,全球市场规模已达325亿美元,预计2032年超785亿。亚利桑那州立大学研究团队开发动态渗透模型,评估网络安全风险,优化防御策略,助力行业安全高效发展。 随着无人机配送服务的迅速发展 […]
发布时间:2025-03-14 09:03 来源:szf -
新模型量化无人机交付网络中的网络风险
快速阅读: 据《Newswise (新闻稿)》最新报道,新传社报道,全球无人机配送服务快速发展,2023年市场规模达325亿美元,预计2032年将超785亿美元。亚利桑那州立大学研究团队提出一种动态渗透模型,通过分析网络安全风险,评估无人机 […]
发布时间:2025-03-12 21:45 来源:szf -
Perplexity 之谜:低比特量化如何影响 AI 精度
快速阅读: 据《黑客 Noon》最新报道,本文研究了CherryQ在大型语言模型LLaMA2上的量化效果。实验结果显示,CherryQ在3位和4位量化下均优于其他方法,显著降低了困惑度,并在多个下游任务中取得了最高平均得分,展示了其在量化后 […]
发布时间:2025-03-07 10:19 来源:szf -
ChatGPT 风格的模型可以在量化中幸存下来吗?
快速阅读: 据《黑客 Noon》称,我们在Vicuna-1.5上使用3位量化进行实验,组大小为128。通过Vicuna-bench基准的成对比较评估模型性能,使用GPT-4进行评判。结果显示,CherryQ在保持聊天模型性能方面优于其他量化 […]
发布时间:2025-03-07 10:17 来源:szf -
AI 压缩的未来:更智能的量化策略
快速阅读: 据《黑客 Noon》称,本文研究了大型语言模型中的参数异质性现象,发现少量关键参数对模型性能至关重要。基于此,作者提出了新的基于影响的参数选择标准CherryQ,并使用QAT框架优化模型。实验结果显示,CherryQ在多个模型上 […]
发布时间:2025-03-07 10:15 来源:szf -
重新思考 AI 量化:模型效率中缺失的一块
快速阅读: 《黑客 Noon》消息,本文总结了大型语言模型的量化策略及其相关工作,包括后训练量化和量化感知训练方法。研究发现,在量化过程中,参数异常值的处理是一个关键问题。我们首次系统地揭示了不同模型间参数影响的异常值,并提出了一种优化异质 […]
发布时间:2025-03-07 10:12 来源:szf -
使用 GNN 和图核量化全球城市道路网络的非同构性
快速阅读: 据《Nature.com》最新报道,本文遵循知识共享署名-非商业性使用-禁止演绎4.0国际许可协议,允许非商业用途的分享、分发和复制,但不得改编。引用原作者和出处即可,文中受知识共享许可保护的图片或其他材料除外。详细信息请访问h […]
发布时间:2025-02-22 20:31 来源:szf