MCP：新的“USB-C for AI”将激烈的竞争对手聚集在一起

发布时间：2025年4月1日来源：szf

快速阅读: 据《Ars Technica》称，本文解释了AI领域中“语境”的含义，即用户提供的输入数据序列，包括提示、对话历史及外部信息等，用于指导模型生成输出。AI模型的语境容量有限，称为“上下文长度”。当前AI模型的“认知”通过预训练和微调嵌入神经网络，训练后进入只读推理模式。

典型例子包括将人工智能模型连接至家庭自动化系统、实时天气数据、电子商务平台及音乐流媒体服务的服务器。某些实现允许AI助手与游戏引擎、三维建模软件以及物联网设备互动。那么，“语境”究竟指什么呢？若想充分理解为何为外部数据源制定通用AI标准是有价值的，就需要了解“语境”在AI领域的意义。

目前的AI模型架构中，AI模型对世界的“认知”以一种几乎不可更改的形式嵌入其神经网络内。这种形式要么通过一种称为“预训练”的初始流程达成，即计算大量输入数据（如书籍、文章和图像）间的统计关系，并将其作为数值权重导入网络；随后，称为“微调”的流程可能会调整这些权重，以改变行为，例如通过强化学习（RLHF），或提供新概念的例子。通常，训练阶段在计算上极为昂贵，且仅在基础模型完成训练时进行一次，或者在定期的模型更新和微调时偶尔执行。这意味着AI模型只能在训练数据集最终确定的“截止日期”前捕捉事件的内部神经网络表示。之后，AI模型便进入一种名为“推理”的只读模式，在此模式下，用户将输入数据传递给神经网络，以生成输出，这些输出被称为“预测”。之所以称为预测，是因为系统被调整为预测用户提供的序列中下一个最可能的标记（数据块，如单词的一部分）。

在AI领域，语境是用户提供的序列——所有输入AI模型的数据，用来引导模型生成响应输出。这个语境包含用户的输入（“提示”）、对话历史记录（在聊天机器人的情况下），以及会话中引入的任何外部信息来源，包括用于定义模型行为的“系统提示”和用于回忆过往对话片段的“记忆”系统。模型一次能够摄入的语境量的限制通常被称为“上下文长度”。

(以上内容均由Ai生成)