韩国AI挑战者推出本土大模型,瞄准ChatGPT
快速阅读: 韩国企业如LG、Naver、SKT、Upstage和NC AI积极参与政府推动的“主权AI”计划,推出本土化AI系统,以应对OpenAI和谷歌的市场主导地位,提升韩语和韩国文化处理能力。
韩国企业在大型语言模型竞赛中崭露头角,各大财团和初创企业纷纷推出本土化人工智能系统,以应对OpenAI和谷歌的市场主导地位。LG、Naver、SKT、Upstage和NC AI等公司正积极开发针对韩语和韩国文化的AI模型,参与政府推动的“主权AI”计划。
韩国政府选定五个财团参与该计划,目标是开发至少达到ChatGPT性能95%的主权AI基础模型。最终将通过一系列评估选出两个团队。这些企业正在努力提升各自在快速发展的韩国AI领域的竞争力。
### LG AI Research Exaone:紧凑型混合模型挑战前沿
LG AI Research于7月推出的Exaone 4.0迅速成为韩国主权AI竞赛的领跑者。它在人工智能分析指数中排名靠前,位列韩国模型第一,开放权重模型第四,全球第十一。Exaone 4.0结合了推理功能,性能可与规模更大的前沿模型媲美。
该系统提供两种版本:高性能32B参数模型适用于计算密集型任务,轻量级1.2B参数版本则优化用于设备端。此外,它具备多模态视觉语言能力,能够分析图像、文档和图表。在“图表QA”基准测试中,Exaone在解读企业文件和图表方面取得了全球最高分之一。
LG的大型语言模型主要面向企业需求,如自动化工作流程、数据分析和金融、制药、制造等行业的研究支持。作为政府全国AI竞赛的五家入选企业之一,LG的目标是基于Exaone 4.0的经验,开发出世界最高水平的前沿AI模型“K-Exaone”。
### SK Telecom A.X:开源模型专为韩语环境设计
电信巨头SK Telecom凭借A.X模型在主权AI领域占据一席之地。A.X是一个专门为韩语和韩国文化设计的开源模型。A.X 4.0在本地基准测试中表现优于OpenAI的GPT-4,分别在KMMLU和CLIcK测试中得分78和83,这两项测试衡量韩语知识和文化细微差别的能力。A.X 3.1版本于7月发布,采用34亿参数,由SK Telecom自主研发,涵盖模型设计和数据训练的所有阶段。
自2019年推出KoBERT以来,SK Telecom通过大规模持续预训练和“从零开始”的方法不断推进自身模型。最新版本A.X 4.0和A.X 3.1的性能与OpenAI的GPT-4相当,同时在理解韩语上下文方面表现出世界级水平。
SK Telecom已将A.X模型应用于实际服务,如客户服务中心的“AI秘书”功能,未来还将推出付费服务。除了消费服务,SK Telecom还推广A.X作为政府机构和金融机构的主权选项,这些机构更倾向于使用本地系统而非外国云平台。
### Upstage Solar Pro:初创企业挑战AI巨头
韩国AI初创企业Upstage推出的Solar Pro 2于7月发布,尽管参数仅为31亿,但在多项测试中仍能匹敌甚至超越规模更大的竞争对手。Solar Pro 2是唯一被英国人工智能分析指数列为“前沿模型”的韩国大型语言模型。
Upstage凭借Solar Pro 2在国际舞台上崭露头角,展示了其在AI领域的实力。该公司计划进一步升级Solar Pro 2的推理和多模态功能,以增强其市场竞争力。
韩国初创企业Upstage在“性能与运行成本比”评估中排名第一,引发了埃隆·马斯克的强烈反应。马斯克在其社交媒体上坚称,他的Grok 4模型仍居首位。Upstage强调了Solar Pro 2在多语言处理方面的能力,展示了其在韩语自然语言处理领域的强大表现。同时,该公司正瞄准法律、金融和医疗等知识密集型领域,这些领域对效率和准确性有着极高的要求。作为唯一入选韩国国家AI项目的初创企业,Upstage代表了灵活挑战者在这一传统上由财团和外国科技公司主导的领域中的崛起。
基于Solar Pro 2的开发经验,Upstage计划从零开始设计新的架构和训练算法。预计推出的Solar WBL模型参数量将在100亿至300亿之间,将逐步扩展其语言能力、多模态功能和行业特定版本。
韩国互联网巨头Naver于2021年推出HyperClova,成为该国首个大规模语言模型。四年后,Naver Cloud推出了其继任者HyperClova X,这款旗舰级超大规模模型在韩语语言、文化和背景方面表现出色。Naver表示,HyperClova X的训练数据量是OpenAI的GPT-4的6500倍。尽管Naver未透露HyperClova X的确切参数数量,但行业分析师认为,其规模远小于ChatGPT、Gemini或DeepSeek等全球主要模型。然而,HyperClova X在处理韩语任务时表现出色,根据KMMLU基准测试,其表现优于GPT-4。
HyperClova X系列包括推理专用模型HyperClova X Think、轻量级版本HyperClova X Dash和免费开源版本HyperClova X Seed。除了专长于韩语外,HyperClova在中文、日文和越南语方面也表现出色。Naver还计划与美国AI初创企业Twelve Labs及国内大学合作,利用其在韩语模型方面的优势,构建能够处理文本、图像、音频和视频等多样数据类型的自有全基础模型。
尽管Kakao未能入选负责开发韩国主权AI的五家公司之一,但这家拥有KakaoTalk的互联网巨头一直在积极发展自己的AI技术。自去年推出Kanana大语言模型以来,Kakao不断扩展产品线,包括轻量级版本Kanana Nano(21亿参数)、中型版本Essence(98亿参数)和旗舰版本Flag(325亿参数)。今年5月,Kakao进一步进军多模态AI领域,推出Kanana-o,支持文本、图像和语音处理,并开放源代码升级版Kanana 1.5。Kakao围绕Kanana品牌展开AI战略,春季推出同名独立消息应用,内置AI助手,直接嵌入个人和群聊中。最引人关注的是Kakao与AI巨头OpenAI的合作,预计将于9月公布详细内容。双方计划年底前推出AI代理,覆盖Kakao广泛的平台生态系统。
尽管在韩国AI领域相对低调,但NC AI凭借其子公司NCSoft 14年的研究积累和联盟策略,成功入选政府主权AI项目。NCSoft早在2011年就成立了AI部门,积累了广泛的技术储备。
2023年7月,韩国游戏公司发布了Varco,成为韩国游戏行业首个推出自有大模型的企业。一年后,该公司推出了Varco 2.0,其小模型和基础模型分别拥有70亿和130亿参数,提升了模型能力。
最近,该公司上个月发布了Varco Vision 2.0,这是一款多模态模型,完整版和轻量版分别拥有140亿和17亿参数,并且均为开源。该模型能够同时处理图像和文本以回答问题。尽管规模相对较小,但在多个基准测试中,该模型的表现超过了其他开源模型,如InternVL3-14B、Ovis2-16B和Qwen2.5-VL 7B,涵盖英语和韩语图像理解及光学字符识别。
主权AI的竞争日益激烈,各国纷纷加速建设自己的大模型,以确保技术独立。韩国也不例外,政府已选定五家领先企业牵头开发符合国家需求的本土模型。在此背景下,《韩国先驱报》推出特别系列报道,探讨韩国AI行业的现状及其在全球的地位,重点关注专注于韩语的系统。本期报道将聚焦韩国本地公司开发的大模型及其在关键测试中的表现。
(以上内容均由Ai生成)