Uber印度推司机数据分类任务,助力AI模型发展
快速阅读: Uber在印度推出新服务,允许司机通过应用程序参与数据分类和信息收集,增加收入。该服务已覆盖12个城市,数万司机参与,有望全球推广,支持企业客户开发AI模型。
近日,Uber在印度推出了一项新服务,允许其共享乘车和外卖司机在空闲时间通过应用程序参与数据分类和信息收集的工作。这项消息由Uber AI解决方案全球负责人Megha Yethadka在LinkedIn上发布,她表示,司机在日常工作中可能有空闲时间,或希望在晚上赚取额外收入。
这项新的工作任务包括审查照片、计数物品、分类文本、录制音频以及数字化收据等多种形式。Yethadka提到,这些任务将用于支持Uber全球的企业客户,帮助他们开发生成式人工智能模型或消费应用。
Yethadka进一步表示:“迄今为止,这些任务一直由独立承包商在应用程序外完成。初步结果显示非常积极,我们期待将这项服务进一步扩展。”在她发布的视频中,提到了这项服务有潜力在全球范围内推广。
Uber印度及南亚的总裁Prabhjeet Singh表示,这些新任务已在12个城市推出,且“数以万计的司机”已经开始参与Uber所称的“数字任务”。
Uber首席执行官Dara Khosrowshahi在8月份的财报电话会议上提到,数字任务的推出是因为Uber公司具备将任务分配给全球赚取者的核心能力。“你将会看到一种不同类型的赚取者,他们将为全球令人兴奋的AI发展工作。”Khosrowshahi表示。
此外,Uber还在同一天宣布,他们正在运营一个350PB(拍字节)的数据湖,并开发了一种名为“HiveSync”的工具来保护这些数据。Uber工程团队的公告解释说,以前Uber的数据基础设施在两个数据中心区域之间运行以确保冗余,但这样导致第二个区域在运行时没有实际使用,产生了不必要的费用。
因此,Uber启动了“单区域计算”(SRC)计划,将所有批量计算任务在单一区域内运行,然后通过HiveSync将数据复制到第二个区域。HiveSync是Uber自2016年开始开发的,现在管理约300PB的数据,存储在80万张Hive表中,每天复制8PB的数据。
Uber表示,他们计划开源这一复制服务,并继续开发新功能,以满足日益增长的可扩展性和低延迟需求。HiveSync在Uber将批量数据分析和机器学习训练系统迁移到谷歌云的过程中也发挥了重要作用。
(以上内容均由Ai生成)