AI 数据提供商 Toloka 筹集了 $72M 的资金
快速阅读: 《硅角度》消息,荷兰AI数据集提供商托洛卡AI宣布完成7200万美元融资,由贝佐斯探险基金领投。该公司为AI企业提供定制数据集,支持多种语言和编程语言。此轮融资后,其母公司尼比乌斯将失去多数投票权,但仍保留大部分经济利益。托洛卡计划加速增长,推动AI模型训练和安全测试。
荷兰人工智能数据集提供商托洛卡AI公司今日宣布,已完成7200万美元的融资。本轮融资由贝佐斯探险基金领投,该基金隶属于前亚马逊公司首席执行官杰夫·贝佐斯。Shopify首席技术官米哈伊尔·帕拉欣也参与了此次投资。托洛卡是纳斯达克上市的人工智能基础设施服务提供商尼比乌斯集团的一个部门。这家总部位于荷兰的公司曾是俄罗斯搜索引擎Yandex的母公司。尼比乌斯于2023年被纳斯达克暂停交易,并在2024年剥离其俄罗斯资产后重新开始交易。目前,该公司的主要业务是运营一个专为人工智能工作负载优化的公共云。2022年12月,尼比乌斯从英伟达、Accel等投资者那里筹集了7亿美元资金,以提升平台的基础设施。计划在新泽西州建设新的数据中心并扩展多个现有设施。
在今天的投资之后,尼比乌斯将不再对托洛卡拥有多数投票权控制,并且不会将其收益计入季度财务结果,但会保留“显著多数的经济利益”。阿姆斯特丹的托洛卡提供定制的数据集,人工智能企业可以利用这些数据集来训练他们的模型。它依赖于超过20万名标注员和其他专业人士组成的网络来创建这些数据集。根据托洛卡的说法,其网络中的专家可以在40多种语言中创建人工智能训练材料。
在训练神经网络之后,公司通常会对输出进行优化,使其更符合用户偏好。例如,零售商可能希望每个由AI生成的购物推荐都至少提到其目录中的两种产品,以使AI模型符合用户需求的过程涉及为其提供额外的训练数据。托洛卡表示,其平台使得开发人员更容易获取必要的训练数据。它支持RLHF和DPO这两种最广泛使用的对齐方法。在RLHF项目中,开发人员使用第二个经过训练以理解用户偏好的神经网络来微调AI模型的输出。相比之下,DPO不依赖第二个神经网络,这通常使这种方法更具成本效益。托洛卡还承诺简化训练AI编程助手的任务。该公司可以提供超过十几种编程语言的代码示例。用户可以根据需要自定义训练数据集中代码文件的数量、这些文件执行的任务以及它们使用的开发框架。
在发布AI模型到生产环境之前,开发人员使用一种称为红队测试的方法来确保其安全性。他们向模型提供大量模拟恶意输入的提示,并评估其响应方式。根据托洛卡的说法,AI团队可以通过其平台获得此类提示,以加速红队测试计划。该公司的平台被Anthropic PBC(一家资金雄厚的编码助手初创公司Poolside)以及其他人工智能市场的主要参与者使用。
托洛卡表示,今天的投资将推动其业务实现“重大且快速的增长”。图片:托洛卡
SiliconANGLE联合创始人约翰·弗里尔的一则信息:“您的支持对我们非常重要,它让我们能够让内容保持免费。只需轻点一下即可支持我们提供免费、深入且相关的内容的使命。加入包含超过15,000名#Cube校友专家的社群,加入包括亚马逊CEO安迪·贾西、戴尔科技创始人兼CEO迈克尔·戴尔、英特尔CEO帕特·格尔辛格等众多名人和专家的社区。”
“CUBE是行业的重要合作伙伴。你们真的是我们活动的一部分,我们非常感谢你们的到来,我知道人们也非常赞赏你们制作的内容。”——安迪·贾西
谢谢您!
(以上内容均由Ai生成)