MCP:新的“USB-C for AI”将激烈的竞争对手聚集在一起
快速阅读: 据《Ars Technica》称,本文解释了AI领域中“语境”的含义,即用户提供的输入数据序列,包括提示、对话历史及外部信息等,用于指导模型生成输出。AI模型的语境容量有限,称为“上下文长度”。当前AI模型的“认知”通过预训练和微调嵌入神经网络,训练后进入只读推理模式。
典型例子包括将人工智能模型连接至家庭自动化系统、实时天气数据、电子商务平台及音乐流媒体服务的服务器。某些实现允许AI助手与游戏引擎、三维建模软件以及物联网设备互动。那么,“语境”究竟指什么呢?若想充分理解为何为外部数据源制定通用AI标准是有价值的,就需要了解“语境”在AI领域的意义。
目前的AI模型架构中,AI模型对世界的“认知”以一种几乎不可更改的形式嵌入其神经网络内。这种形式要么通过一种称为“预训练”的初始流程达成,即计算大量输入数据(如书籍、文章和图像)间的统计关系,并将其作为数值权重导入网络;随后,称为“微调”的流程可能会调整这些权重,以改变行为,例如通过强化学习(RLHF),或提供新概念的例子。通常,训练阶段在计算上极为昂贵,且仅在基础模型完成训练时进行一次,或者在定期的模型更新和微调时偶尔执行。这意味着AI模型只能在训练数据集最终确定的“截止日期”前捕捉事件的内部神经网络表示。之后,AI模型便进入一种名为“推理”的只读模式,在此模式下,用户将输入数据传递给神经网络,以生成输出,这些输出被称为“预测”。之所以称为预测,是因为系统被调整为预测用户提供的序列中下一个最可能的标记(数据块,如单词的一部分)。
在AI领域,语境是用户提供的序列——所有输入AI模型的数据,用来引导模型生成响应输出。这个语境包含用户的输入(“提示”)、对话历史记录(在聊天机器人的情况下),以及会话中引入的任何外部信息来源,包括用于定义模型行为的“系统提示”和用于回忆过往对话片段的“记忆”系统。模型一次能够摄入的语境量的限制通常被称为“上下文长度”。
(以上内容均由Ai生成)