蚂蚁数科推出多语种视觉大模型训练框架,高效识别文档伪造与逻辑矛盾

发布时间:2025年11月4日    来源:szf
蚂蚁数科推出多语种视觉大模型训练框架,高效识别文档伪造与逻辑矛盾

快速阅读: 蚂蚁数科发布多语种多模态大模型训练框架,解决小语种环境下的语言错乱问题,在CVQA测试中领先,准确率提升9.5%,并推出图像安全框架,增强数字内容风险控制。

近日, 蚂蚁数科在香港金融科技节上发布了一项革命性的技术 ——“多语种多模态大模型训练框架”,旨在解决当前大模型在多语言环境中的应用瓶颈。随着人工智能技术的飞速发展,大模型正逐渐成为提升各行业效率的重要工具。然而,传统以英文为母语的大模型在小语种环境中表现不佳,常常面临 “语言错乱” 和推理信息混乱的问题,这严重制约了其全球化应用。

为应对这一挑战,蚂蚁数科的研究团队开发了这一新框架,并在多文化多语言视觉问答基准测试(CVQA)中取得了显著成果。该框架在埃及阿拉伯语、印尼爪哇语、巴哈萨语及巽他语等资源稀缺的小语种上表现尤为突出,展现出卓越的多语言识别能力,成功跻身榜首。

这一突破的核心在于创新的语言感知优化框架。该框架通过 “以目标语言进行思考” 的机制,结合细粒度多维度的奖励策略与自动化数据解决方案,实现在小语种的深度理解和处理。根据测试结果,与同等规模的开源模型相比,该框架在主流多语言视觉问答(Multilingual Visual Question Answering, VQA)基准测试中准确率提升了约9.5%,在部分任务中甚至优于 GPT-4o 和 Gemini-2.5-flash 等国际主流闭源模型,获得评测总分 第一 。

在安全能力方面,蚂蚁数科还推出了图像安全框架,结合视觉分析与常识推理的伪造识别路径,能够高效识别图像中的视觉不一致性和逻辑矛盾。这一技术不仅能够定位篡改区域,还能进行可解释分析,显著提升数字内容的风险控制能力。

作为蚂蚁数科全球业务的核心技术,这两项能力已在 ZOLOZ 文档识别鉴真产品(RealDoc)中实现了规模化应用,支持119种语言,能够高效处理多语种商务文档、合同和证件,覆盖保险理赔、信贷审核及跨境贸易等多个场景。

(以上内容均由Ai生成)

你可能还想读

D-Wave新系统上线,助力解决国家安全难题

D-Wave新系统上线,助力解决国家安全难题

快速阅读: D-Wave与Davidson合作开发的量子计算系统,通过Leap云服务准备就绪,旨在解决国家安全难题,包括雷达跟踪、资源规划及物流,未来还将探索机密任务和国防领域应用。 新系统已通过D-Wave的Leap云服务准备好供客户使用 […]

发布时间:2025年11月4日
Meta与Hugging Face推出OpenEnv,共建AI代理环境共享平台

Meta与Hugging Face推出OpenEnv,共建AI代理环境共享平台

快速阅读: Meta与Hugging Face联合发布OpenEnv,旨在标准化AI代理环境的创建与分享。OpenEnv Hub提供安全沙箱,支持构建、测试和部署代理环境,确保任务安全性和一致性,促进开放源码RL生态系统发展。 Meta 的 […]

发布时间:2025年11月4日
AI重塑职场:智能代理引领未来变革

AI重塑职场:智能代理引领未来变革

快速阅读: 普华永道研究显示,67%的高管认为AI代理将在12个月内显著改变现有角色,48%可能因此增员。AI代理提升组织决策效率,需建立坚实的技术与运营基础。 这一变革将不可避免地重塑角色和组织设计。团队将从微观管理流程转向监督AI代理, […]

发布时间:2025年11月4日
韩国2026年预算大幅增加AI投入

韩国2026年预算大幅增加AI投入

快速阅读: 韩国总统李在明宣布2026年预算草案,将人工智能领域预算增加三倍至10.1万亿韩元,目标成为全球前三AI强国,重点投资工业应用、技能开发和基础设施建设,预算总额约728万亿韩元。 韩国总统李在明周二宣布,在2026年预算草案中, […]

发布时间:2025年11月4日
三星扩展Galaxy AI语言支持至22种

三星扩展Galaxy AI语言支持至22种

快速阅读: 三星宣布扩大Galaxy AI语言支持至22种,新增古吉拉特语和菲律宾语,强调此举将使更多地区用户受益,随时获取帮助。 三星今日(11月3日)向《Android Central》发布声明,宣布将扩大其语言支持范围,以覆盖更多地区 […]

发布时间:2025年11月4日
英伟达与德电共建百亿欧元AI云中心

英伟达与德电共建百亿欧元AI云中心

快速阅读: 美国科技巨头英伟达与德国电信宣布,将于2026年初联合推出十亿欧元的工业人工智能云中心,作为安全的“主权基础设施”,支持德国及欧洲企业在设计到机器人技术领域的AI应用。 柏林,2025年11月4日(BSS/AFP)- 美国科技巨 […]

发布时间:2025年11月4日
李在明宣布5060亿美元预算,聚焦AI时代开启

李在明宣布5060亿美元预算,聚焦AI时代开启

快速阅读: 李在明总统11月4日发表年度预算演讲,提出728万亿韩元预算,强调2026年人工智能时代开启,投资将增至10.1万亿韩元,旨在加速国家转型,提升竞争力。 李在明总统于11月4日在首尔西部汝矣岛的国会发表关于明年预算的演讲。[林贤 […]

发布时间:2025年11月4日
博通因与OpenAI合作开发AI芯片,股价十月大涨12%

博通因与OpenAI合作开发AI芯片,股价十月大涨12%

快速阅读: 博通与OpenAI签署重大协议,将合作开发定制AI加速器,预计提供10吉瓦电力的AI芯片,博通可能获1500亿至2000亿美元收入,股价10月上涨12%。 上月,博通(AVGO)股价大幅上涨,原因是该公司与人工智能(AI)初创公 […]

发布时间:2025年11月4日