小型语言模型可能重新定义 AI 竞赛

发布时间:2025年2月22日    来源:szf
小型语言模型可能重新定义 AI 竞赛

快速阅读: 《福布斯》消息,在过去两年中,大型语言模型主导了人工智能领域,但近期转向了更小、更高效的小型语言模型(SLM)。SLM专为特定领域设计,具有更高的精度和效率,降低了运行成本。它们适用于边缘设备,提高了隐私和安全性。SLM在多个行业的应用前景广阔,如医疗保健和客户服务,且更具成本效益。尽管面临数据挑战,SLM仍被认为是未来企业AI的核心。

在过去两年里,大型语言模型主导了人工智能领域。但这种情况可能很快就会发生变化。(照片由基里尔·库德里亚夫采夫 / 法新社提供)(照片由基里尔·库德里亚夫采夫 / 法新社通过盖蒂图片社提供)

当ChatGPT、Gemini及其其他生成式AI同伴在大约两年前崭露头角时,关于大型语言模型的讨论——即训练了大量数据集以理解和生成类似人类文本和视觉内容的人工智能模型——主导了科技界。多年来,人工智能竞赛被规模定义——更大的模型、更多的数据和更强的计算能力。然而最近,人们逐渐从像GPT-4和Gemini这样的大型语言模型转向了更小、更高效且在某些商业应用中可能更强大的东西。

“下一波人工智能正为特定需求而设计,”MobileLive创始人兼首席执行官贾汉·阿里在一次采访中告诉我。“小型语言模型使我们能够针对特定领域的知识训练人工智能模型,使其在现实世界的企业需求中更加有效。”

小型语言模型的崛起

SLM是为特定行业、任务和操作流程精心调整的人工智能模型。与处理大量通用知识的LLM不同,SLM旨在实现精确性和效率。这意味着它们需要更少的计算能力,运行成本显著降低,并且可以提供比大型模型更有针对性的业务洞察。“SLM不仅仅是LLM的简化版本,”阿里解释说。“它们被优化以在特定领域中表现出色——无论是金融、医疗还是软件开发。这使得它们能够提供更准确、可靠的定制化结果。”

Hailo的首席技术官兼联合创始人阿维·鲍姆进一步阐述了这一观点,并告诉我:“当LLM首次出现时,它们的设计目的是展示前所未有的规模智能。但在实际应用中,较小的精炼模型开始出现。这些SLM具备强大的推理能力,同时足够高效,可以在本地运行,无需依赖云计算。”

另一个原因是现在看到对SLM的需求增加,根据鲍姆的说法,是因为LLM存在一些隐私和安全方面的顾虑。许多企业因为担心数据泄露和合规风险而犹豫是否使用基于云的生成式AI工具。有了SLM,企业可以直接将AI部署到边缘设备上,如笔记本电脑、机器人和手机,确保其专有数据得到保障。

小型语言模型与自主AI

关于小型语言模型的讨论不可避免地涉及到更广泛的自主AI的概念——这是新一代所谓的AI代理,与传统AI系统不同,它们自主运作,根据实时数据做出即时决策。为了实现如此惊人的成就,这些代理需要轻量级、快速且高度专业化的模型——而这正是SLM最擅长的地方。

正如斯图·罗伯茨在《Verdict》杂志的一篇文章中指出的,“SLM因其更高的准确性、更低的计算需求以及更小的尺寸和资源需求而优于LLM。”阿里认为这是AI领域下一个重大突破。“SLM使AI代理能够拥有更高的自主决策能力,因为它们是在深入的、特定领域的知识基础上进行训练的。想象一下一个金融AI代理不仅生成市场洞察,还能根据实时数据主动执行交易。或者一个物流AI不仅能追踪供应链,还能自主优化配送路线和库存水平,”他说。

NTT新风险投资和创新全球执行副总裁沙希德·艾哈迈德也分享了相似的愿景。“SLM通过在边缘实现自主决策,与自主AI的广泛趋势相吻合。例如,在智能工厂中,AI代理可以使用SLM主动检测设备故障、调整机器设置或安排维护——所有这些都不需要人工干预。”

这在各个行业中都有着巨大的影响:从医疗保健——SLM可以辅助更精准地诊断疾病——到客户服务——它们可以支持真正理解行业术语的AI代理——应用范围无限。

SLM的商业价值

OpenAI、谷歌和安提克均投入了数十亿美元来训练他们的前沿大型语言模型。虽然这些模型非常有用,作为研究人员从中提炼出的小型模型的基础,但许多人认为成本不合理,并质疑如此大规模投资的回报率。这就是为什么人工智能开发的经济形势似乎正朝着有利于SLM的方向发展。

根据艾哈迈德的说法,SLM最大的优势在于其成本效益。“大型模型需要大量的计算能力,这导致更高的运营成本。而SLM则消耗更少的资源,同时为特定任务提供高精度。这使得企业在商业上获得了更高的投资回报,”他说——这一点阿里也强烈赞同,他指出LLM和SLM之间的投资回报差距变得越来越明显。“为什么要花费数百万美元来训练和运行大型的LLM,当你可以通过一个更小、更便宜且完全符合你需求的模型获得更好的商业效果时?”阿里反问道。

小型语言模型也面临一些挑战,尤其是在训练过程中,通常需要高质量的领域特定数据。SLM在需要广泛上下文知识的长篇推理任务中也可能会遇到困难。网络安全和AI专家、OurCrowd的首席运营官尤瓦尔·伊卢兹在接受采访时指出了这一数据挑战:“选择合适的训练数据是让SLM发挥作用的关键。没有高质量的数据集,SLM会迅速变得不可信。最佳方法是持续使用真实业务数据重新训练模型。”

尽管存在这些障碍,伊卢兹相信SLM将是未来企业AI的核心。“正迈向一个混合AI的世界,企业将结合使用LLM和SLM。LLM将继续用于通用知识,而SLM将处理那些需要精确性、安全性和速度的业务关键操作。”

价值追求

AI革命始于认为更大的模型意味着更好的结果。但现在,公司迅速认识到业务影响比模型大小更重要。对于许多商业领袖来说,问题不在于人们选择了哪种AI模型,而是“哪种模型能真正为我们公司创造业务价值?”正如阿里所指出的,“不仅仅是建立更聪明的AI——而是要建立真正服务于企业的AI。”而SLM证明,有时候,少即是多。

(以上内容均由Ai生成)

你可能还想读

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

快速阅读: 谷歌推出Pixel 10手机及Pixel Watch 4,新增卫星紧急通讯、可更换电池和屏幕、抬手通话等功能,屏幕亮度达3000尼特,还将与斯蒂芬·库里合作推出AI健康和健身教练服务。 谷歌本周在“由谷歌制造”活动中推出了Pix […]

发布时间:2025年8月23日
SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日