什么是 AI 蒸馏?

发布时间:2025年3月30日    来源:szf
什么是 AI 蒸馏?

快速阅读: 据《技术雷达》最新报道,蒸馏技术通过简化AI模型,使其更高效且易于部署。最初由杰弗里·欣顿团队提出,蒸馏让AI在家庭电脑上广泛应用。相比微调,蒸馏创建新模型模拟大模型行为,开启更私密安全的AI应用,缩小昂贵模型与实际应用间的差距。

(图片来源:N鲍威尔/Flux)

**蒸馏:让AI更高效的小秘密**

蒸馏,又被称为模型蒸馏或知识蒸馏,是一种从大型复杂的人工智能“教师”模型向更小、更高效“学生”模型转移知识的过程。通过这种方式,我们可以创建更小巧的模型文件,尽管继承了许多教师模型的能力,但大幅减少了计算需求。

正如所见:
– OpenAI的一位消息人士声称有证据表明“蒸馏”正在发生。
– 它使用了剪枝、模型蒸馏等技术。

在开源社区里,蒸馏技术非常流行,因为它允许将紧凑型AI模型部署到个人电脑系统上。一个流行的例子是在开源DeepSeek R1平台发布后不久,世界各地创建了大量的小型蒸馏模型。

**蒸馏的历史**

蒸馏的概念最初由被誉为“AI教父”的杰弗里·欣顿和他的团队于2015年提出。这项技术迅速成为在适度计算平台上实现高级AI的有效方法之一。蒸馏使得——并且继续使得——日常AI应用的广泛使用成为可能,否则这些应用需要在巨大的基于云的计算机上进行处理。

大多数蒸馏模型可以在家庭电脑上运行,因此世界上有成千上万的AI应用程序在使用,执行诸如音乐和图像生成或业余科学等任务。

**蒸馏的工作原理**

蒸馏的工作原理是利用较大的教师模型生成输出,然后由学生模型学习模仿这些输出。学生模型不仅仅是复制这些输出,而是通常从中学习,并利用这些学习成果构建教师模型的精简版本。

不仅开源领域使用蒸馏技术。像OpenAI和Google这样的公司开发的基础模型通常会被蒸馏成更易于分发给企业和个人的版本。这些公司还经常为他们的顶级客户提供蒸馏工具,以帮助他们创建较小的模型版本。

**蒸馏与微调的区别**

需要注意的是,蒸馏与微调完全不同。蒸馏创建了一个新的较小模型,模拟较大模型的行为,而微调则是通过在特定任务的数据上训练模型来适应特定任务。

有趣的是,无论是蒸馏模型还是微调模型,在某些任务或职责上有时能优于其更大的同类模型。然而,在蒸馏的情况下,结果模型会失去主模型原本包含的一些广泛知识。这种情况在微调模型中不一定发生。

主要有三种蒸馏方法:响应、特征和关系导向技术。不深入技术细节,每种方法都专注于以不同的方式模拟原始模型的能力。每种方法在学生模型的质量方面都有优缺点。

正因为如此,不同的基础模型公司采用不同的方法,以在市场上获得性能优势。

**蒸馏的重要性**

(图片来源:Pexels.com)

蒸馏现在已成为企业AI世界的关键部分,因为随着时间推移,旗舰基础模型需要巨大的资源才能运行。与其处理数万亿个参数,需要城市规模的数据中心和电源,小型蒸馏模型可以在大型企业或政府组织的本地环境中运行。

这类选项的广泛可用性使AI成为一种更加民主化的技术,并将其好处扩展到更广泛的受众群体。它还开启了更多私密和安全的AI应用。蒸馏还有其他优点,较小的模型运行速度更快,能耗显著降低。它们占用的内存空间更小,还可以针对特定任务进行训练。

这些特点使蒸馏成为现代AI领域不可或缺的一部分,缩小了昂贵的基础模型与普通用户可使用的实际应用之间的差距。

**尼格尔·鲍威尔**
社交链接导航
科技撰稿人

尼格尔·鲍威尔是一位拥有超过30年科技行业经验的作者、专栏作家和顾问。他在《星期日泰晤士报》撰写了16年的“别慌”科技专栏,并著有哈珀柯林斯出版的《星期日泰晤士报计算机解答》一书。他曾是天空电视台《全球村庄》节目的科技评论员,并定期为BBC广播五台《男人时间》节目撰稿。他是软件、安全、隐私、移动、人工智能和技术创新领域的专家。

(以上内容均由Ai生成)

关键词: Ai蒸馏

你可能还想读

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

快速阅读: 谷歌推出Pixel 10手机及Pixel Watch 4,新增卫星紧急通讯、可更换电池和屏幕、抬手通话等功能,屏幕亮度达3000尼特,还将与斯蒂芬·库里合作推出AI健康和健身教练服务。 谷歌本周在“由谷歌制造”活动中推出了Pix […]

发布时间:2025年8月23日
SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日