Grab 自研语言模型解决亚洲语言识别难题

发布时间:2025年11月4日    来源:szf
Grab 自研语言模型解决亚洲语言识别难题

快速阅读: 新加坡Grab公司发现现有大型语言模型难以有效理解东南亚语言,决定自研视觉大型语言模型,以改善客户身份验证等工作中的文档处理效果。该模型基于阿里巴巴云Qwen2-VL2B,经过微调后在东南亚语言文档处理上取得显著进展,未来将继续开发更多模型。

新加坡 超级 应用程序公司 Grab 近日在其工程博客上分享了其自研语言模型的开发经历,指出现有的大型语言模型在理解东南亚语言时表现不佳。Grab 的 超级 应用程序提供打车、外卖、购物和金融服务等功能,覆盖新加坡、马来西亚、印尼、菲律宾、越南、泰国、柬埔寨和缅甸等国家,这些地区的文档通常使用非拉丁字母的脚本。

图源备注:图片由AI生成 在执行如客户身份验证等合规工作时,Grab 需要准确提取身份证、驾照和注册证书等信息。尽管尝试过光学字符识别(OCR)系统,但 Grab 发现这些技术在处理多样化的文档模板时效果不理想。

在2025年,Grab 开始探索是否可以利用大型语言模型来解决这一问题。尽管一些强大的商业模型具备能力,但在理解东南亚语言时常出现错误和延迟,而开源的视觉大型语言模型虽然更高效,但准确性仍不足。因此,Grab 决定自行构建一个视觉大型语言模型,该模型能将图像向量化,方便提取文本。

Grab 选择了阿里巴巴云的 Qwen2-VL2B 模型作为基础,因为它的体积适中,支持东南亚语言,并能动态处理不同分辨率的图像。随后,Grab 从 Common Crawl 中提取了东南亚语言的内容,并建立了内部合成数据管道,以生成各种字体和背景下的文本图像。团队采用低秩适配技术对 Qwen2-VL 进行微调,取得了在印尼文档处理上的良好效果。

尽管在泰语和越南语的识别上仍然存在挑战,Grab 最终决定进行完整参数微调。通过训练模型,使其学习东南亚语言的独特视觉模式,Grab 成功开发了一个轻量级的视觉大型语言模型,其表现超越了多种 OCR 工具和通用模型。Grab 表示,战略性地使用高质量数据,能够使小型专业模型实现高效与有效的结合。

未来,Grab 计划继续开发更多自有模型,以扩展其文档处理技术。

划重点: 📊 Grab 发现现有大型语言模型在东南亚语言识别上效果不佳,决定自研模型解决问题。

🔍 自研的视觉大型语言模型在处理身份证和驾照等文档时取得了显著进展。

🚀 Grab 将继续开发更多模型,以满足日益复杂的文档处理需求。

(以上内容均由Ai生成)

你可能还想读

中科曙光发布万卡AI超算集群

中科曙光发布万卡AI超算集群

快速阅读: 记者从中科曙光获悉,该公司于12月19日在江苏昆山发布国内首个万卡级人工智能超算集群scaleX平台,总算力超5 EFLOPS,将为科研机构及企业提供高效算力支持,推动AI基础设施建设与产业应用落地。 12月19日,总部位于北京 […]

发布时间:2025年12月20日
谷歌AI模式日活达7500万

谷歌AI模式日活达7500万

快速阅读: 据Ahrefs消息,谷歌AI Mode日活用户已达7500万,Gemini 3 Flash模型已全面部署,以提升响应速度与多轮对话能力;但I/O大会宣布的个性化上下文功能仍处内测,尚未上线。 谷歌AI搜索功能用户规模迅速扩大,但 […]

发布时间:2025年12月20日
AI泡沫破裂 董事会或担责

AI泡沫破裂 董事会或担责

快速阅读: 12月20日消息,据NERA报告,2025年上半年美国提起13起AI相关证券诉讼,远超2024年全年的16起,主要因企业夸大AI收益或淡化风险,已引发监管对信息披露真实性的严查。 据NERA报告,2025年上半年,美国提起的与人 […]

发布时间:2025年12月20日
Uber称AI应用已带来数亿美元收益

Uber称AI应用已带来数亿美元收益

快速阅读: 截至发稿时,优步CEO科斯罗萨希在声明中表示,公司聚焦AI实际应用而非底层硬件投入,已通过智能推荐和故障诊断等场景创造数亿美元效益,并加快工程师招聘以提升人效。此外,优步正深化与Waymo等自动驾驶企业合作,探索平台化运力整合模 […]

发布时间:2025年12月20日
英国政府发布AI与版权临时政策

英国政府发布AI与版权临时政策

快速阅读: 据英国政府方面消息,该国于近日发布人工智能与版权政策中期更新,计划建立“退出机制”,允许AI企业默认使用受版权保护作品进行训练,除非权利人提出反对。此举引发创意产业强烈反弹,作家协会等组织已发起“公平对待”运动,并呼吁强制披露训 […]

发布时间:2025年12月20日
2025年AI生成虚假信息被揭穿

2025年AI生成虚假信息被揭穿

快速阅读: 据外媒报道,2025年以来,多起AI伪造视频在社交平台传播,涉及萨拉赫、蕾哈娜及非洲政要等,内容均被证实为虚构。此类虚假信息常通过镜像翻转、AI语音或生成图像制作,部分虽标注“讽刺”仍误导公众,凸显提升辨识能力的紧迫性。 202 […]

发布时间:2025年12月20日
多伦多科技领袖推“代理AI”新战略框架

多伦多科技领袖推“代理AI”新战略框架

快速阅读: 据多家机构披露,数字产品转型专家亚杜·卡拉纳林甘指出,大语言模型热潮已进入“宿醉期”,业界正从聊天机器人转向能主动完成任务的智能代理。 数字产品转型专家亚杜·卡拉纳林甘指出,当前正处于大语言模型热潮过后的“宿醉期”。过去两年,众 […]

发布时间:2025年12月20日
Krafton联合韩企设6000亿卢比基金聚焦印度科技

Krafton联合韩企设6000亿卢比基金聚焦印度科技

快速阅读: 据路透社报道,美国政府正审查是否首次批准英伟达H200 AI芯片对华出口。该芯片是美方第二强的AI处理器,若获批将被征收25%附加费。批评人士警告此举可能助长中国军事与AI发展,并被前拜登政府官员认为是“重大战略失误”。 韩国企 […]

发布时间:2025年12月20日