AI

腾讯发布混元开源模型,涵盖0.5B至7B参数量

发布时间:2025年8月4日    来源:szf
腾讯发布混元开源模型,涵盖0.5B至7B参数量

快速阅读: 近日,腾讯混元团队发布四款小尺寸开源模型,参数分别为0.5B、1.8B、4B和7B,专为消费级显卡设计,适用于低功耗场景,支持低成本微调,丰富了开源模型体系,已在多个业务中应用,提升效率和准确性。

近日,腾讯混元团队发布了四款开源小尺寸模型,参数分别为0.5B、1.8B、4B和7B。这些模型专为消费级显卡设计,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景,并支持垂直领域的低成本微调。此举进一步丰富了混元开源模型体系,为开发者和企业提供了更多尺寸的模型选择。

腾讯混元大模型持续开源的一部分,旨在为开发者和企业提供更多选择,以满足不同场景的需求。目前,这些模型已在GitHub和HuggingFace等开源社区上线,并获得了Arm、高通、Intel、联发科技等多个消费级终端芯片平台的支持。

新推出的四个模型属于融合推理模型,具备推理速度快、性价比高的特点。用户可根据使用场景灵活选择模型的思考模式:快思考模式提供简洁、高效的输出,适合简单任务;慢思考模式则涉及解决复杂问题,具备更全面的推理步骤。在效果上,这些模型在语言理解、数学、推理等领域表现出色,在多个公开测试集上得分达到领先水平。

这四个模型的亮点在于其Agent能力和长文处理能力。通过精心的数据构建和强化学习奖励信号设计,这些模型在任务规划、工具调用和复杂决策以及反思等Agent能力上表现出色,能够轻松胜任深度搜索、Excel操作、旅行攻略规划等任务。此外,模型原生长上下文窗口达到256K,意味着模型可以一次性记住并处理相当于40万中文汉字或50万英文单词的超长内容,相当于一口气读完3本《哈利波特》小说,并记住所有人物关系和剧情细节,还能根据这些内容讨论后续故事发展。

在部署方面,这四个模型均只需单卡即可部署,部分PC、手机、平板等设备可直接接入。模型具有较强的开放性,主流推理框架(如SGLang、vLLM和TensorRT-LLM)和多种量化格式均能支持。

应用层面,这四款小尺寸模型能够满足从端侧到云端、从通用到专业的多样化需求,已在腾讯多个业务中应用,其可用性和实用性经过了实践检验。例如,依托模型原生的超长上下文能力,腾讯会议AI小助手和微信读书AI助手实现了对完整会议内容和整本书籍的一次性理解和处理。在端侧应用上,腾讯手机管家利用小尺寸模型提升垃圾短信识别准确率,实现毫秒级拦截,隐私零上传;腾讯智能座舱助手通过双模型协作架构解决车载环境痛点,充分发挥模型低功耗、高效推理的特性。

(以上内容均由Ai生成)

你可能还想读

英伟达4B小模型登顶ARC评测,成本仅GPT-5 Pro的136

英伟达4B小模型登顶ARC评测,成本仅GPT-5 Pro的136

快速阅读: 12月8日消息,英伟达推出4B参数小模型NVARC,在ARC-AGI2评测中以27.64%准确率超越GPT-5Pro,单任务推理成本仅0.2美元,凭借零预训练策略和合成数据实现高效低成本部署。 近日,英伟达研发的4B参数小模型N […]

发布时间:2025年12月8日
Meta收购Limitless加码AI可穿戴设备

Meta收购Limitless加码AI可穿戴设备

快速阅读: 据最新消息,Meta收购AI可穿戴设备公司Limitless,后者以无屏幕智能吊坠著称,具备语音交互与实时转录功能;收购后团队并入Meta,专注AI硬件研发,现有产品将停售但提供一年技术支持。 日前,美国科技企业Meta宣布收购 […]

发布时间:2025年12月8日
沐曦股份科创板申购中签率公布

沐曦股份科创板申购中签率公布

快速阅读: 12月8日消息,沐曦集成电路科创板IPO网上申购户数达517.52万户,启动回拨后最终中签率升至0.03348913%,拟募资39.04亿元用于高性能GPU研发及产业化。 12月8日,国产GPU企业沐曦集成电路(上海)股份有限公 […]

发布时间:2025年12月8日
阿里推Qwen3-TTS:49音色10语9方言,WER碾压商用模型

阿里推Qwen3-TTS:49音色10语9方言,WER碾压商用模型

快速阅读: 12月8日消息,阿里巴巴推出通义千问Qwen3-TTS语音合成模型,支持49种音色、10种语言及9种方言,免费开放每月百万字符额度,并在上海120所中小学试点教育应用。 今日,阿里巴巴正式推出通义千问Qwen3系列新成员——Qw […]

发布时间:2025年12月8日
京东云JoyBuilder千卡训练提速3.5倍

京东云JoyBuilder千卡训练提速3.5倍

快速阅读: 12月8日消息,京东云JoyBuilder平台完成关键升级,支持GR00T N1.5千卡训练,兼容LeRobot框架,训练效率提升3.5倍,亿级数据训练从15小时缩短至22分钟。 日前,京东云JoyBuilder模型开发平台完成 […]

发布时间:2025年12月8日
麦肯锡:AI将取代8亿岗位,同时创造新机遇

麦肯锡:AI将取代8亿岗位,同时创造新机遇

快速阅读: 据麦肯锡全球研究院消息,到2030年全球或有8亿岗位被人工智能取代,同时创造1.3亿至2.3亿新岗位,冲击驾驶、物流、医疗、法律等多个行业,专家呼吁加强再培训与政策应对。 日前,人工智能技术快速发展引发全球关注。加州大学伯克利分 […]

发布时间:2025年12月8日
可灵AI上线主体库,角色跨场景“永不变脸”

可灵AI上线主体库,角色跨场景“永不变脸”

快速阅读: 12月8日消息,快手旗下可灵AI发布“主体库”,为O1视频模型新增长期记忆能力,用户上传单图即可跨场景调用一致角色,主体一致性超96%,并推分级服务与2025年多人功能规划。 今日,快手旗下可灵AI正式发布“主体库”(Subje […]

发布时间:2025年12月8日
n1n.ai 重塑大模型API成本与体验

n1n.ai 重塑大模型API成本与体验

快速阅读: 据最新消息,大模型API平台n1n.ai整合近500种开源与闭源模型,价格低至官方十分之一,响应快、稳定性高,已助企业降本超70%并提升用户满意度。 近日,大模型API服务平台n1n.ai凭借高性价比、高稳定性及丰富模型选择,正 […]

发布时间:2025年12月8日