小型语言模型可能重新定义 AI 竞赛

快速阅读: 《福布斯》消息，在过去两年中，大型语言模型主导了人工智能领域，但近期转向了更小、更高效的小型语言模型（SLM）。SLM专为特定领域设计，具有更高的精度和效率，降低了运行成本。它们适用于边缘设备，提高了隐私和安全性。SLM在多个行业的应用前景广阔，如医疗保健和客户服务，且更具成本效益。尽管面临数据挑战，SLM仍被认为是未来企业AI的核心。

在过去两年里，大型语言模型主导了人工智能领域。但这种情况可能很快就会发生变化。（照片由基里尔·库德里亚夫采夫 / 法新社提供）（照片由基里尔·库德里亚夫采夫 / 法新社通过盖蒂图片社提供）

当ChatGPT、Gemini及其其他生成式AI同伴在大约两年前崭露头角时，关于大型语言模型的讨论——即训练了大量数据集以理解和生成类似人类文本和视觉内容的人工智能模型——主导了科技界。多年来，人工智能竞赛被规模定义——更大的模型、更多的数据和更强的计算能力。然而最近，人们逐渐从像GPT-4和Gemini这样的大型语言模型转向了更小、更高效且在某些商业应用中可能更强大的东西。

“下一波人工智能正为特定需求而设计，”MobileLive创始人兼首席执行官贾汉·阿里在一次采访中告诉我。“小型语言模型使我们能够针对特定领域的知识训练人工智能模型，使其在现实世界的企业需求中更加有效。”

小型语言模型的崛起

SLM是为特定行业、任务和操作流程精心调整的人工智能模型。与处理大量通用知识的LLM不同，SLM旨在实现精确性和效率。这意味着它们需要更少的计算能力，运行成本显著降低，并且可以提供比大型模型更有针对性的业务洞察。“SLM不仅仅是LLM的简化版本，”阿里解释说。“它们被优化以在特定领域中表现出色——无论是金融、医疗还是软件开发。这使得它们能够提供更准确、可靠的定制化结果。”

Hailo的首席技术官兼联合创始人阿维·鲍姆进一步阐述了这一观点，并告诉我：“当LLM首次出现时，它们的设计目的是展示前所未有的规模智能。但在实际应用中，较小的精炼模型开始出现。这些SLM具备强大的推理能力，同时足够高效，可以在本地运行，无需依赖云计算。”

另一个原因是现在看到对SLM的需求增加，根据鲍姆的说法，是因为LLM存在一些隐私和安全方面的顾虑。许多企业因为担心数据泄露和合规风险而犹豫是否使用基于云的生成式AI工具。有了SLM，企业可以直接将AI部署到边缘设备上，如笔记本电脑、机器人和手机，确保其专有数据得到保障。

小型语言模型与自主AI

关于小型语言模型的讨论不可避免地涉及到更广泛的自主AI的概念——这是新一代所谓的AI代理，与传统AI系统不同，它们自主运作，根据实时数据做出即时决策。为了实现如此惊人的成就，这些代理需要轻量级、快速且高度专业化的模型——而这正是SLM最擅长的地方。

正如斯图·罗伯茨在《Verdict》杂志的一篇文章中指出的，“SLM因其更高的准确性、更低的计算需求以及更小的尺寸和资源需求而优于LLM。”阿里认为这是AI领域下一个重大突破。“SLM使AI代理能够拥有更高的自主决策能力，因为它们是在深入的、特定领域的知识基础上进行训练的。想象一下一个金融AI代理不仅生成市场洞察，还能根据实时数据主动执行交易。或者一个物流AI不仅能追踪供应链，还能自主优化配送路线和库存水平，”他说。

NTT新风险投资和创新全球执行副总裁沙希德·艾哈迈德也分享了相似的愿景。“SLM通过在边缘实现自主决策，与自主AI的广泛趋势相吻合。例如，在智能工厂中，AI代理可以使用SLM主动检测设备故障、调整机器设置或安排维护——所有这些都不需要人工干预。”

这在各个行业中都有着巨大的影响：从医疗保健——SLM可以辅助更精准地诊断疾病——到客户服务——它们可以支持真正理解行业术语的AI代理——应用范围无限。

SLM的商业价值

OpenAI、谷歌和安提克均投入了数十亿美元来训练他们的前沿大型语言模型。虽然这些模型非常有用，作为研究人员从中提炼出的小型模型的基础，但许多人认为成本不合理，并质疑如此大规模投资的回报率。这就是为什么人工智能开发的经济形势似乎正朝着有利于SLM的方向发展。

根据艾哈迈德的说法，SLM最大的优势在于其成本效益。“大型模型需要大量的计算能力，这导致更高的运营成本。而SLM则消耗更少的资源，同时为特定任务提供高精度。这使得企业在商业上获得了更高的投资回报，”他说——这一点阿里也强烈赞同，他指出LLM和SLM之间的投资回报差距变得越来越明显。“为什么要花费数百万美元来训练和运行大型的LLM，当你可以通过一个更小、更便宜且完全符合你需求的模型获得更好的商业效果时？”阿里反问道。

小型语言模型也面临一些挑战，尤其是在训练过程中，通常需要高质量的领域特定数据。SLM在需要广泛上下文知识的长篇推理任务中也可能会遇到困难。网络安全和AI专家、OurCrowd的首席运营官尤瓦尔·伊卢兹在接受采访时指出了这一数据挑战：“选择合适的训练数据是让SLM发挥作用的关键。没有高质量的数据集，SLM会迅速变得不可信。最佳方法是持续使用真实业务数据重新训练模型。”

尽管存在这些障碍，伊卢兹相信SLM将是未来企业AI的核心。“正迈向一个混合AI的世界，企业将结合使用LLM和SLM。LLM将继续用于通用知识，而SLM将处理那些需要精确性、安全性和速度的业务关键操作。”

价值追求

AI革命始于认为更大的模型意味着更好的结果。但现在，公司迅速认识到业务影响比模型大小更重要。对于许多商业领袖来说，问题不在于人们选择了哪种AI模型，而是“哪种模型能真正为我们公司创造业务价值？”正如阿里所指出的，“不仅仅是建立更聪明的AI——而是要建立真正服务于企业的AI。”而SLM证明，有时候，少即是多。

(以上内容均由Ai生成)