SK Telecom 在 Hugging Face 上推出 AX 4.0 LLM
快速阅读: 《快速模式》消息,SK电信发布韩语处理能力最强的开源大模型AX 4.0,包含标准与轻量级版本,提升数据安全与本地部署能力,适用于企业及研究领域。
SK电信宣布,他们已发布AX(Adot X)4.0,这是一款具有世界最高韩语处理能力的韩国专用大语言模型,并将其作为开源项目发布。SKT通过全球开源社区Hugging Face发布了AX 4.0的两个模型,分别是标准模型和轻量级模型。
最近发布的AX 4.0在现有大规模语言模型(LLMs)中拥有最高的韩语处理效率,同时具备考虑数据安全的设计,并能够在本地环境中运行。它是一款开源模型,名为Qwen2.5,已经使用大量韩语数据进行训练,以提供适合国内商业环境的优化性能。
SKT设计并应用了AX 4.0的分词器,以实现高水平的韩语处理能力。根据其自身的测试结果,当输入相同的韩语句子时,AX 4.0的标记效率比GPT-4o高出约33%,并且在保持高信息处理能力的同时具备成本效益。
此外,AX 4.0在代表性的韩语语言能力评估基准KMMLU上获得了78.3分,表现优于GPT-4o(72.5分),在韩语与文化基准CLIcK上获得83.5分,显示出比GPT-4o(80.2分)更高的韩语文化理解能力。
此外,SKT计划以可在公司内部服务器上直接安装和使用的本地部署方式提供AX 4.0,以便企业减少对数据安全的担忧。特别是,在AX 4.0的开发过程中,整个大规模学习(CPT,持续预训练)过程都是使用公司自身数据完成的,没有外部连接,从而确保数据主权,即企业对数据的完全控制权。
此外,标准模型有720亿(72B)个参数,轻量级模型有70亿(7B)个参数,允许用户根据用途选择性地使用。
SKT已于5月成功将AX 4.0应用于Adot电话摘要,并计划在未来将其应用于SK集团内部的各种服务以及自身服务。
通过这次SKT推出的模型,企业可以基于该模型开发衍生模型,并应用于研究领域。
SKT还计划在AX 4.0知识库模型开源发布的同时发布推理模型。SKT计划在本月内发布一个增强数学问题解决和代码开发能力的推理模型,并提升模型至能同时理解和处理图像与文本的水平。
SK电信AI模型实验室负责人金智媛表示:我们计划持续开发技术以提升SK电信的各项服务,并成为一家在企业市场上以韩语专业大语言模型优化的企业。
(以上内容均由Ai生成)