亚马逊推出Nova Forge:轻松构建定制前沿模型
快速阅读: 亚马逊推出Nova Forge服务,帮助组织构建定制AI模型,解决专业领域知识嵌入难题,减少灾难性遗忘,提升模型性能和安全性,支持多领域应用,促进AI技术发展。
各组织正在迅速扩大在业务各个领域使用生成式人工智能。对于需要深厚领域知识或特定业务背景的应用,模型必须真正理解其专有知识、工作流程和独特需求。尽管诸如提示工程和检索增强生成(RAG)等技术在许多用例中表现出色,但在将专业知识嵌入模型核心理解方面存在根本限制。监督微调和强化学习有助于定制模型,但它们在开发周期后期操作,在已经完全训练的模型上叠加修改,难以引导模型适应特定领域。
当组织试图通过仅使用专有数据进行持续预训练(CPT)来实现更深层次的定制时,经常会遇到灾难性遗忘问题,即模型在学习新内容时丧失了基础能力。同时,从零开始训练模型所需的数据、计算能力和成本对大多数组织来说仍然是难以克服的障碍。
今天,我们推出亚马逊Nova Forge,这是一项新的服务,旨在帮助您使用Nova构建自己的前沿模型。Nova Forge客户可以从早期模型检查点开始开发,将其数据集与亚马逊Nova策划的训练数据混合,并安全地在AWS上托管自定义模型。Nova Forge是构建自有前沿模型最简单且最具成本效益的方式。
### 用例和应用场景
Nova Forge专为拥有专有或行业特定数据并希望构建真正理解其领域的AI的组织设计。这包括:
– 制造与自动化:构建了解专门工艺、设备数据和行业特定工作流程的模型。
– 研发:创建基于专有研究数据和领域特定知识训练的模型。
– 内容与媒体:开发理解品牌声音、内容标准和特定审核要求的模型。
– 专业行业:训练基于行业特定术语、法规和最佳实践的模型。
根据具体用例,Nova Forge可用于增加差异化功能、提高任务特定准确性、降低成本和降低延迟。
### Nova Forge的工作原理
Nova Forge通过允许您从预训练、中期训练和后期训练阶段的早期检查点开始模型开发,解决了当前定制方法的局限性。您可以将专有数据与亚马逊Nova策划的数据在整个训练阶段混合,利用亚马逊SageMaker AI的全托管基础设施运行训练。这种方法显著减少了仅使用原始数据训练时的灾难性遗忘,有助于保留基础技能——包括核心智能、一般指令遵循能力和安全性——同时融入您的专业知识。
Nova Forge还提供了在您自己的环境中使用奖励函数进行强化学习的能力。这使得模型能够从代表您用例的环境中生成的反馈中学习。除了单步评估外,您还可以使用自己的编排器管理多轮滚动,实现复杂代理工作流和顺序决策任务的强化学习训练。无论您是使用化学工具评分分子设计,还是机器人模拟奖励高效任务完成并惩罚碰撞,都可以直接连接您的专有环境。
您还可以利用Nova Forge内置的负责任AI工具包配置模型的安全性和内容审核设置。您可以根据特定业务需求调整设置,涉及安全、安全性和敏感内容处理等领域。
### 开始使用Nova Forge
Nova Forge与您现有的AWS工作流无缝集成。您可以使用亚马逊SageMaker AI熟悉的工具和基础设施运行训练,然后将自定义Nova模型作为私有模型导入亚马逊Bedrock。这为您提供了与亚马逊Bedrock中任何模型相同的安保性、一致的API和更广泛的AWS集成。
在亚马逊SageMaker Studio中,您现在可以使用亚马逊Nova构建前沿模型。要开始构建模型,请选择要使用的检查点:预训练、中期训练或后期训练。您还可以在此处上传数据集或使用现有数据集。您可以通过混合Nova提供的按领域分类的策划数据集来融合训练数据,这些数据集有助于模型保持通用性能,防止过拟合或灾难性遗忘。此外,您可以选择使用强化微调(RFT)以提高特定领域的事实准确性和减少幻觉。
训练完成后,将模型导入Amazon Bedrock,并开始在应用程序中使用。需要注意的是,Amazon Nova Forge 已在美国东部(北弗吉尼亚)AWS 区域提供服务。该计划包括访问多个Nova模型检查点、将专有数据与Amazon Nova策划的训练数据混合的培训配方、经过验证的训练配方以及与Amazon SageMaker AI和Amazon Bedrock的集成。更多详情请参阅《Amazon Nova 用户指南》,并从Amazon SageMaker AI 控制台探索Nova Forge。有兴趣的组织还可以联系我们的生成式AI创新中心,以获得模型开发项目的额外支持。——丹尼洛
(以上内容均由Ai生成)