Grab 自研语言模型解决亚洲语言识别难题

发布时间:2025年11月4日    来源:szf
Grab 自研语言模型解决亚洲语言识别难题

快速阅读: 新加坡Grab公司发现现有大型语言模型难以有效理解东南亚语言,决定自研视觉大型语言模型,以改善客户身份验证等工作中的文档处理效果。该模型基于阿里巴巴云Qwen2-VL2B,经过微调后在东南亚语言文档处理上取得显著进展,未来将继续开发更多模型。

新加坡 超级 应用程序公司 Grab 近日在其工程博客上分享了其自研语言模型的开发经历,指出现有的大型语言模型在理解东南亚语言时表现不佳。Grab 的 超级 应用程序提供打车、外卖、购物和金融服务等功能,覆盖新加坡、马来西亚、印尼、菲律宾、越南、泰国、柬埔寨和缅甸等国家,这些地区的文档通常使用非拉丁字母的脚本。

图源备注:图片由AI生成 在执行如客户身份验证等合规工作时,Grab 需要准确提取身份证、驾照和注册证书等信息。尽管尝试过光学字符识别(OCR)系统,但 Grab 发现这些技术在处理多样化的文档模板时效果不理想。

在2025年,Grab 开始探索是否可以利用大型语言模型来解决这一问题。尽管一些强大的商业模型具备能力,但在理解东南亚语言时常出现错误和延迟,而开源的视觉大型语言模型虽然更高效,但准确性仍不足。因此,Grab 决定自行构建一个视觉大型语言模型,该模型能将图像向量化,方便提取文本。

Grab 选择了阿里巴巴云的 Qwen2-VL2B 模型作为基础,因为它的体积适中,支持东南亚语言,并能动态处理不同分辨率的图像。随后,Grab 从 Common Crawl 中提取了东南亚语言的内容,并建立了内部合成数据管道,以生成各种字体和背景下的文本图像。团队采用低秩适配技术对 Qwen2-VL 进行微调,取得了在印尼文档处理上的良好效果。

尽管在泰语和越南语的识别上仍然存在挑战,Grab 最终决定进行完整参数微调。通过训练模型,使其学习东南亚语言的独特视觉模式,Grab 成功开发了一个轻量级的视觉大型语言模型,其表现超越了多种 OCR 工具和通用模型。Grab 表示,战略性地使用高质量数据,能够使小型专业模型实现高效与有效的结合。

未来,Grab 计划继续开发更多自有模型,以扩展其文档处理技术。

划重点: 📊 Grab 发现现有大型语言模型在东南亚语言识别上效果不佳,决定自研模型解决问题。

🔍 自研的视觉大型语言模型在处理身份证和驾照等文档时取得了显著进展。

🚀 Grab 将继续开发更多模型,以满足日益复杂的文档处理需求。

(以上内容均由Ai生成)

你可能还想读

D-Wave新系统上线,助力解决国家安全难题

D-Wave新系统上线,助力解决国家安全难题

快速阅读: D-Wave与Davidson合作开发的量子计算系统,通过Leap云服务准备就绪,旨在解决国家安全难题,包括雷达跟踪、资源规划及物流,未来还将探索机密任务和国防领域应用。 新系统已通过D-Wave的Leap云服务准备好供客户使用 […]

发布时间:2025年11月4日
Meta与Hugging Face推出OpenEnv,共建AI代理环境共享平台

Meta与Hugging Face推出OpenEnv,共建AI代理环境共享平台

快速阅读: Meta与Hugging Face联合发布OpenEnv,旨在标准化AI代理环境的创建与分享。OpenEnv Hub提供安全沙箱,支持构建、测试和部署代理环境,确保任务安全性和一致性,促进开放源码RL生态系统发展。 Meta 的 […]

发布时间:2025年11月4日
AI重塑职场:智能代理引领未来变革

AI重塑职场:智能代理引领未来变革

快速阅读: 普华永道研究显示,67%的高管认为AI代理将在12个月内显著改变现有角色,48%可能因此增员。AI代理提升组织决策效率,需建立坚实的技术与运营基础。 这一变革将不可避免地重塑角色和组织设计。团队将从微观管理流程转向监督AI代理, […]

发布时间:2025年11月4日
韩国2026年预算大幅增加AI投入

韩国2026年预算大幅增加AI投入

快速阅读: 韩国总统李在明宣布2026年预算草案,将人工智能领域预算增加三倍至10.1万亿韩元,目标成为全球前三AI强国,重点投资工业应用、技能开发和基础设施建设,预算总额约728万亿韩元。 韩国总统李在明周二宣布,在2026年预算草案中, […]

发布时间:2025年11月4日
三星扩展Galaxy AI语言支持至22种

三星扩展Galaxy AI语言支持至22种

快速阅读: 三星宣布扩大Galaxy AI语言支持至22种,新增古吉拉特语和菲律宾语,强调此举将使更多地区用户受益,随时获取帮助。 三星今日(11月3日)向《Android Central》发布声明,宣布将扩大其语言支持范围,以覆盖更多地区 […]

发布时间:2025年11月4日
英伟达与德电共建百亿欧元AI云中心

英伟达与德电共建百亿欧元AI云中心

快速阅读: 美国科技巨头英伟达与德国电信宣布,将于2026年初联合推出十亿欧元的工业人工智能云中心,作为安全的“主权基础设施”,支持德国及欧洲企业在设计到机器人技术领域的AI应用。 柏林,2025年11月4日(BSS/AFP)- 美国科技巨 […]

发布时间:2025年11月4日
李在明宣布5060亿美元预算,聚焦AI时代开启

李在明宣布5060亿美元预算,聚焦AI时代开启

快速阅读: 李在明总统11月4日发表年度预算演讲,提出728万亿韩元预算,强调2026年人工智能时代开启,投资将增至10.1万亿韩元,旨在加速国家转型,提升竞争力。 李在明总统于11月4日在首尔西部汝矣岛的国会发表关于明年预算的演讲。[林贤 […]

发布时间:2025年11月4日
博通因与OpenAI合作开发AI芯片,股价十月大涨12%

博通因与OpenAI合作开发AI芯片,股价十月大涨12%

快速阅读: 博通与OpenAI签署重大协议,将合作开发定制AI加速器,预计提供10吉瓦电力的AI芯片,博通可能获1500亿至2000亿美元收入,股价10月上涨12%。 上月,博通(AVGO)股价大幅上涨,原因是该公司与人工智能(AI)初创公 […]

发布时间:2025年11月4日