蚂蚁数科推出多语种视觉大模型训练框架,高效识别文档伪造与逻辑矛盾

发布时间:2025年11月4日    来源:szf
蚂蚁数科推出多语种视觉大模型训练框架,高效识别文档伪造与逻辑矛盾

快速阅读: 蚂蚁数科发布多语种多模态大模型训练框架,解决小语种环境下的语言错乱问题,在CVQA测试中领先,准确率提升9.5%,并推出图像安全框架,增强数字内容风险控制。

近日, 蚂蚁数科在香港金融科技节上发布了一项革命性的技术 ——“多语种多模态大模型训练框架”,旨在解决当前大模型在多语言环境中的应用瓶颈。随着人工智能技术的飞速发展,大模型正逐渐成为提升各行业效率的重要工具。然而,传统以英文为母语的大模型在小语种环境中表现不佳,常常面临 “语言错乱” 和推理信息混乱的问题,这严重制约了其全球化应用。

为应对这一挑战,蚂蚁数科的研究团队开发了这一新框架,并在多文化多语言视觉问答基准测试(CVQA)中取得了显著成果。该框架在埃及阿拉伯语、印尼爪哇语、巴哈萨语及巽他语等资源稀缺的小语种上表现尤为突出,展现出卓越的多语言识别能力,成功跻身榜首。

这一突破的核心在于创新的语言感知优化框架。该框架通过 “以目标语言进行思考” 的机制,结合细粒度多维度的奖励策略与自动化数据解决方案,实现在小语种的深度理解和处理。根据测试结果,与同等规模的开源模型相比,该框架在主流多语言视觉问答(Multilingual Visual Question Answering, VQA)基准测试中准确率提升了约9.5%,在部分任务中甚至优于 GPT-4o 和 Gemini-2.5-flash 等国际主流闭源模型,获得评测总分 第一 。

在安全能力方面,蚂蚁数科还推出了图像安全框架,结合视觉分析与常识推理的伪造识别路径,能够高效识别图像中的视觉不一致性和逻辑矛盾。这一技术不仅能够定位篡改区域,还能进行可解释分析,显著提升数字内容的风险控制能力。

作为蚂蚁数科全球业务的核心技术,这两项能力已在 ZOLOZ 文档识别鉴真产品(RealDoc)中实现了规模化应用,支持119种语言,能够高效处理多语种商务文档、合同和证件,覆盖保险理赔、信贷审核及跨境贸易等多个场景。

(以上内容均由Ai生成)

你可能还想读

多地社区抵制数据中心项目并取得成效

多地社区抵制数据中心项目并取得成效

快速阅读: 据《时代》杂志报道,其委托田纳西大学诺克斯维尔分校开展的研究显示,xAI公司位于孟菲斯的数据中心自2024年运营以来,周边二氧化氮浓度峰值上升79%,引发环保组织与居民对空气污染及公共健康的担忧,并面临潜在诉讼。 其他正在推进或 […]

发布时间:2025年12月20日
亚马逊推网页版Alexa+对标ChatGPT

亚马逊推网页版Alexa+对标ChatGPT

快速阅读: 12月20日消息,亚马逊推出新一代Alexa+助手网页版,用户可通过浏览器访问Alexa.com使用聊天机器人式界面。此举使该服务摆脱对Echo设备和语音交互的依赖,操作方式更接近ChatGPT等工具,但部分高级功能仍限区域或账 […]

发布时间:2025年12月20日
上海民办学校推进小班化与智能评价

上海民办学校推进小班化与智能评价

快速阅读: 截至发稿时,上海市民办中小学协会举办成立20周年思享荟,近300名教育界人士共商高质量发展路径。受人口结构变化与人工智能影响,专家呼吁民办教育转向内涵提升,强化个性化育人、教师队伍建设和智慧校园发展,以回应“上好学”需求。 12 […]

发布时间:2025年12月20日
商务部部长会见AMD CEO苏姿丰

商务部部长会见AMD CEO苏姿丰

快速阅读: 据媒体报道,AMD首席执行官苏姿丰近日访华,先后会见中国商务部和工信部负责人,就深化在华合作、加大投资及推动人工智能与数字经济发展交换意见,并参观联想总部展示的前沿技术成果。 12月18日,商务部部长王文涛在北京会见美国超威半导 […]

发布时间:2025年12月20日
迈克尔・伯里质疑英伟达出货数据征集囤货证据

迈克尔・伯里质疑英伟达出货数据征集囤货证据

快速阅读: 最新消息显示,美国投资者迈克尔·伯里质疑英伟达CEO黄仁勋关于Blackwell GPU出货量的说法,指出其披露的600万颗与基于收入数据推算的约400万颗存在明显差距,并呼吁提供GPU被大量囤积的实证材料。 近日,因成功预测2 […]

发布时间:2025年12月20日
Apache Doris推HSAP架构支持Agent高效混合搜索

Apache Doris推HSAP架构支持Agent高效混合搜索

快速阅读: 据最新进展,Apache Doris 4.0推出混合搜索与分析处理(HSAP)架构,统一支持结构化、全文及向量查询,通过单次SQL请求实现多模态检索融合,显著降低延迟,并提升RAG等智能应用的准确性与实时性。 人工智能时代正深刻 […]

发布时间:2025年12月20日
智谱通过港交所聆讯 上半年营收1.9亿元

智谱通过港交所聆讯 上半年营收1.9亿元

快速阅读: 据沙利文报告,智谱华章已通过港交所上市聆讯,有望成为全球首家上市的大模型企业。其GLM系列模型技术领先,已服务20多个行业、1.2万家机构,2025年上半年营收达1.9亿元,研发投入为15.9亿元。 北京智谱华章科技股份有限公司 […]

发布时间:2025年12月20日
校园安防技术效果存疑

校园安防技术效果存疑

快速阅读: 据校园安全杂志报道,布朗大学12月13日发生枪击事件,造成2人死亡、9人受伤,校方计划升级门禁与监控系统;专家质疑包括AI武器识别在内的40亿美元校园安防技术缺乏实证,强调“就地封锁”等基础应急措施更为有效。 2025年12月1 […]

发布时间:2025年12月19日