沙特AI实验室发布首个阿拉伯语大模型Kawn,支持多方言交流
快速阅读: 沙特AI实验室Misraj在AWS re:Invent大会发布Kawn,涵盖Mutarjim、Lahjawi及Kawn Document OCR,解决阿拉伯语AI市场空白,支持多方言交流与文档识别,推动阿拉伯数字化转型。
近日,沙特阿拉伯的AI实验室Misraj AI在AWS re:Invent大会上推出了全新的阿拉伯语大语言模型Kawn。该模型旨在促进各行业阿拉伯语的交流,提供多种模型和服务,支持阿拉伯语的应用。
Kawn模型的一个重要特点Mutarjim是一种双向阿拉伯语-英语翻译模型。此外,Lahjawi是首个支持15种阿拉伯方言的翻译模型,使跨方言交流更加便利,特别适合用于聊天机器人和客户支持等场景。Kawn还包含Kawn Document OCR,这是一个视觉语言模型,能够识别和提取文件中的阿拉伯文本。
Misraj AI的首席执行官Safwan AlModhayan表示,Kawn的推出旨在填补市场上高质量阿拉伯本土AI系统的空白。他指出,许多现有的AI模型最初是为英语构建的,之后才进行了阿拉伯语适配,这导致在准确性、方言支持以及在政府、医疗、金融和教育等重要领域中的可靠性方面存在不足。
为了构建Kawn,团队面临诸多挑战,包括如何设计出能够覆盖阿拉伯地区广泛方言的模型。为此,Misraj开发了一种称为层注入的技术,允许模型在不重新训练整个模型的情况下学习方言变化。另一个挑战是缺乏干净且具有代表性的阿拉伯数据集。为了解决这一问题,团队从多个领域和地区收集和精炼了超过2万亿个阿拉伯语标记,并建立了严格的过滤和质量管控流程。
除了Kawn,Misraj还推出了Workforces,这是一个AI平台,用户可以通过它创建和管理AI代理,以自动化工作流程、分析数据并扩展业务。该平台适用于操作、客户支持、营销和销售等团队,旨在帮助企业自动化重复性流程,提高生产力。
AlModhayan表示,Kawn和Workforces旨在推动阿拉伯数字化转型的新纪元。他们希望帮助各个行业的机构和企业部署能自然使用阿拉伯语、理解地区流程并能与现有系统无缝集成的AI解决方案。展望未来,Misraj计划进一步扩展该平台,推出针对医疗、法律、保险、商业、教育和公共服务等行业的专业模型。同时,他们还在开发更丰富的多模态能力,结合文本、语音和视觉,为用户提供更具互动性的体验。
划重点:
🌟 Kawn是首个阿拉伯语大语言模型,支持阿拉伯语交流与翻译。
🔍 该模型克服了阿拉伯方言多样性和数据集稀缺的挑战。
🚀 Misraj还推出了AI平台Workforces,助力企业自动化工作流程。
(以上内容均由Ai生成)