小型语言模型在企业 AI 中的作用

发布时间：2025年4月14日来源：szf

快速阅读: 据《计算机周刊》称，增强小语言模型可更好地处理特定企业领域问题，相比大模型成本更低。但更新困难且需更大上下文窗口。结合知识图谱与检索增强生成（RAG），能提升准确性和实时性。小模型可在标准硬件上运行，促进AI部署民主化。

增强小语言模型单一的大语言模型或小语言模型可能都无法满足组织的所有需求。企业用户通常希望将公司IT系统中的数据与AI模型结合起来使用。根据多米尼克·托米切维奇，图数据库提供商梅姆格拉夫（Memgraph）的首席执行官所说，上下文是整个模型讨论的核心。

“对于非常通用的家庭作业级别的问题，大语言模型就能很好地完成，但一旦你需要一个基于语言的AI真正有用时，你就必须选择小语言模型，”他说。

阅读更多关于AI模型的文章
AI模型解释：阅读更多关于AI模型的文章
开源AI模型的好处：在这份指南中，我们将探讨如何开始使用开源AI模型，并概述它们如何支持您的企业IT战略。

最新阿里云AI模型展示AI改进：来自中国公共云服务提供商阿里的最新模型展示了强化学习如何推动AI效率。

最新阿里云AI模型展示AI改进：例如，公司的油漆混合方式、构建物联网网络或安排交付的方式都是独特的。

“AI不需要记住1930年世界杯的冠军是谁，”他补充道，“你需要它帮助你优化特定的企业领域问题。”

正如托米切维奇所指出的，小语言模型可以被训练来识别电子商务系统中的订单查询，并在供应链中深入了解该特定领域——使其更擅长回答相关问题。

另一个好处是，对于中型和小型运营来说，训练小语言模型要便宜得多——考虑到GPU和电力的成本。

然而，根据托米切维奇的说法，将供应链数据输入到一个专注的小语言模型中在技术上是一个重大障碍。

“直到LLM和SLM共享的基本架构——即变压器——进化之前，更新语言模型仍然很困难，”他说。

“这些模型倾向于一次性在一个大批次中进行训练，吸收所有数据，然后仅在其认为已知的内容范围内进行推理。”

这意味着无论小语言模型多么专注于业务用例，保持其更新或新鲜度仍然是一个挑战。

“上下文窗口仍需要输入相关信息，”他补充道。

对托米切维奇而言，这就是额外元素发挥作用的地方——组织反复发现知识图谱是与领域训练的小语言模型搭配的最佳数据模型，充当其恒定的导师和解释者。

由图技术驱动的检索增强生成（RAG）可以连接结构化和非结构化数据。托米切维奇说，这使得AI系统能够以更低的成本和更高的准确性检索最相关的见解。

“它还通过动态获取来自最新数据库的数据来增强推理，消除静态存储，确保回复始终基于最新信息，”他说。

根据企业知识管理平台提供商普赖恩（Pryon）的首席执行官克里斯·马尔的说法，小语言模型的资源效率使其能够在标准硬件上运行，同时在需要的地方提供专门的智能。

“这改变了组织部署AI的方式，为之前被认为不适合高级计算的环境带来强大的能力，并实现跨越地理和技术基础设施障碍的访问民主化，”他说。

根据马尔的说法，RAG提供了一条穿透噪音的管道，向小语言模型传递精确的相关上下文。

(以上内容均由Ai生成)

你可能还想读