LG 将自主开发的推理 AI 模型“Exaone Deep”开源发布
快速阅读: 据《韩国时报》最新报道,LG AI研究中心负责人裴京勋博士在首尔举行的LG AI洞察2024活动上发表演讲。LG宣布开源其自主研发的推理型AI模型“ExaOne Deep”,这是韩国首个能与国际顶尖AI公司竞争的模型。该模型在多项测试中表现出色,将在专业和科学领域广泛应用。
LG AI研究中心负责人裴京勋博士于2024年11月21日在首尔西部举行的LG AI洞察2024活动上发表演讲。图片由LG集团提供。记者南贤宇报道:LG AI研究中心于本周二宣布,其自主研发的推理型AI模型“ExaOne Deep”已作为开源发布,标志着与OpenAI、谷歌等全球顶尖AI公司开发的先进AI模型展开激烈竞争。
据该实验室透露,他们在加州圣何塞举办的Nvidia年度GPU技术大会(GTC)上发布了ExaOne Deep,该会议从周一持续至周五。在AI语境下,“推理”指利用知识解决问题、得出结论及预测结果的逻辑过程。将这种推理应用于具体问题解决则被称为“推断”。推理型AI模型被认为是实现具备自主决策能力的代理型AI的关键前提,这类AI能够独立提出假设并进行推断来验证这些假设。
当前,美国的OpenAI、谷歌以及中国的DeepSeek和阿里巴巴正通过基础模型引领市场开发推理型AI模型,而LG的ExaOne Deep是韩国首个能与其竞争的模型。根据全球开源AI平台Hugging Face上的性能评估报告,尽管ExaOne Deep-32B模型仅有320亿参数——仅为DeepSeek R1的5%(后者拥有6710亿参数),但在评估逻辑推理能力和问题解决能力方面表现相当。
参数是模型用于分析数据的学习值,通常被视为衡量模型规模或大小的重要指标。LG AI研究团队指出,ExaOne Deep-32B在处理复杂数学和科学问题方面展现了卓越性能,特别是在韩语环境中尤为突出。该模型在今年韩国大学修学能力考试数学试卷中获得了94.5分的高分,并在所有选考科目中取得最佳成绩。同时,它还在MATH-500测试中获得95.7分,用以评估数学问题解决能力。此外,该模型在Google-Proof Q&A基准钻石测试中评估物理、化学和生物研究生水平科学推理能力时达到了66.1分,超过了相同参数规模的其他推理型AI模型。另外,在LiveCodeBench测试中,它获得了59.5分,展示了较强的编码能力。
LG AI研究团队预计ExaOne Deep将在专业和科学领域得到广泛应用。在开源发布时,ExaOne Deep-32B被美国非营利AI研究组织Epoch AI评选为值得关注的AI模型之一。除32B模型外,该实验室还推出了轻量级的ExaOne Deep-7.8B和设备端的ExaOne Deep-2.4B作为开源项目。轻量级模型保留了32B模型95%的性能,但其规模仅为前者的24%,而设备端模型在仅占其规模7.5%的情况下实现了86%的性能。
“就在我们宣布即将推出一款性能可媲美DeepSeek R1的AI模型一个月后,我们现在自豪地推出了ExaOne Deep,”LG AI研究团队的一位官员说道。“LG AI技术的核心在于显著减小模型规模的同时保持高性能。”
LG AI研究中心是LG集团的AI智库,致力于开发ExaOne作为基础模型,以支持LG Uplus的ixi系列产品及LG电子的ThinQ等多变体模型。在古宽模主席的带领下,该实验室正在扩大其在全球AI行业的影响力。在新年致辞中,古宽模表示:“我们将创造一种全新的生活方式,让人们能够在日常生活中轻松使用诸如AI这样的尖端技术,从而腾出更多宝贵时间去做更有意义且充满乐趣的事情。”
(以上内容均由Ai生成)