2025 年小型 AI 的巨大力量
快速阅读: 《科技共和国》消息,在人工智能领域,小型语言模型(SLM)因其训练和部署速度快、成本低等优势受到青睐。预计未来五年,SLM市场将以15%的速度增长。SLM特别适合时间序列预测等任务,且开源后能更好地处理治理和隐私等问题。企业可结合使用大型语言模型(LLM)和SLM,以解决复杂业务问题并降低成本。未来,SLM将在提升人工智能代理的自主性和推理能力方面发挥关键作用。
在人工智能领域,小规模正变得非常重要。许多软件公司,尤其是那些希望快速增加人工智能解决方案的公司,越来越多地转向小型语言模型(SLM),这些模型所需的数据集较小。专为特定企业任务设计,这些模型不仅训练和部署速度更快,而且已经优于或至少不逊色于同样大小的模型,这对任何想要实施人工智能的公司来说都是好消息,特别是那些资源、预算或时间有限的公司。小型语言模型市场预计在未来五年内将以稳定的速度增长15%。另一方面,许多人工智能应用中使用的更为知名的大型语言模型(LLM)是通过大规模数据集进行训练的。这些数据可能需要数月时间来训练,而这仅仅是开始——通常还需要人工微调。根据一些估算,大型语言模型涉及显著的开发支出,可能达到数百万美元,这可能是大多数软件公司和初创企业的重大财务负担。
随着小型语言模型越来越受欢迎,下一步会怎样?小型语言模型非常适合寻求快速实现目标的公司,也是许多公司的首选,因为它们使用的参数更少,可以从零开始构建,也可以由大型语言模型改编而来。当小型语言模型开源时,它们将变得更加强大,并且通过在精心策划的企业数据集上训练,可以更好地处理治理、风险管理、隐私保护和偏见缓解等问题,这在2025年及以后变得越来越重要。随着小型语言模型越来越受欢迎,下一步会怎样?
在众多应用场景中,小型语言模型在预测时间序列数据的结果时找到了一个甜蜜点。时间对于业务至关重要,每个组织都有销售、需求、收入和产能要求的预测;这称为时间序列预测,它涉及基于过去在固定时间间隔收集的观察值来预测未来值,无论是每天、每月、每季度还是每年。人工智能有望加速并优化这种多变量预测的业务规划。例如,一种名为Tiny Time Mixers(TTMs)的小型语言模型可以迅速生成与时间相关的输出,预测不同领域的未来趋势,如电力消耗、交通拥堵、零售和金融。这种模型被AI驱动的投资解决方案领先者量子街AI公司用于帮助从新闻和其他数据源提取ESG数据和情感信号,以帮助其平台预测跨行业的股票价格变动。随着创新的继续,模型将接受更多数据的训练,并提供更强的表现力,同时支持外部变量和滚动预测。人工智能已经开始以我们刚开始设想的方式改变商业。然而,近两年来关于人工智能的狂热炒作必须考虑到成本、信任和资源因素。事实上,公司可能会倾向于结合使用大型语言模型和小型语言模型,首先使用较大的模型解决一些最具挑战性的业务问题,一旦得到答案,就切换到较小的模型,以更低的成本和降低的延迟复制结果。
展望未来,小型语言模型将在推进具有更大自主性、复杂推理和多步骤问题解决能力的人工智能代理方面发挥重要作用。小型语言模型支持关键的代理能力,如高级推理和特定功能调用,这对于确保代理能够连接外部API、重新评估行动计划并自我纠正至关重要。实施人工智能的企业必须在高性能模型和实用模型之间找到恰当的平衡。可以把小型语言模型比作跑车,而大型语言模型则是房车——两者都能带你到达目的地,但满足不同的需求。正是那些相对于模型大小而言性能高,并且兼顾安全性、速度和成本效益的模型更容易在多样化的商业环境中集成。
展望未来,小型语言模型将在推进具有更大自主性、复杂推理和多步骤问题解决能力的人工智能代理方面发挥重要作用。小型语言模型支持关键的代理能力,如高级推理和特定功能调用,这对于确保代理能够连接外部API、重新评估行动计划并自我纠正至关重要。无论你的公司今天正在试点人工智能项目,还是明天探索人工智能代理的使用,小型语言模型都将显著影响你快速在整个业务中实施人工智能的能力。
(以上内容均由Ai生成)