海外AI模型在韩国高考数学测试中领先

发布时间:2025年12月16日    来源:szf
海外AI模型在韩国高考数学测试中领先

快速阅读: 据科技和ICT部方面消息,韩国国产AI大模型在高丽大学主导的数学能力测评中显著落后于国际主流系统,主要原因是科学训练数据不足。部长裵京勋12月16日表示,将聚焦构建领域专用数据集,并优先发展可部署的轻量级模型。

韩国自主研发的人工智能大模型在近期一项学术能力测试中明显落后于国际领先系统。此次评估由高丽大学数学系教授金俊洛克领衔的研究团队开展,旨在回应社会对国产“主权AI”模型缺乏公开测评的关切。

研究团队选取10个大型语言模型,要求其解答50道高难度数学题。其中20题来自韩国大学修学能力考试(CSAT)数学部分,涵盖微积分、概率统计与几何等内容;另30题为论文式题目,取自韩国顶尖高校、印度入学考试及东京大学研究生试题。结果显示,海外模型占据前列:谷歌Gemini 3 Pro Preview以92分居首,正确解答46题;Anthropic的Claude Opus 4.5得84分,xAI的Grok 4.1 Fast获82分,OpenAI的GPT-5.1得80分,中国深度求索DeepSeek V3.2得76分。

相比之下,韩国本土模型整体得分偏低。Upstage开发的Solar Pro 2以58分位列国内第一;Naver的HCX-007得26分;LG AI Research的EXAONE 4.0.1与SK Telecom的A.X 4.0(72B)均得24分;NC AI的轻量级模型Llama-VARCO-8B-Instruct仅得2分,排名垫底。即便允许使用Python计算工具辅助推理,差距仍未缩小。

后续采用EntropyMath数据集的测试也呈现类似趋势。该数据集覆盖从本科课程到科研级数学难度。金俊洛克强调,本次评估基于各机构已公开发布的模型版本,并计划待“国家队”版本推出后再次测试。

产业界指出,多数韩国企业聚焦服务型与工业AI应用,如智能体开发,而非通用学术推理能力。科技和ICT部长裵京勋12月16日在世宗市记者会上表示,当前国产基础模型多针对商业场景优化,科学与数学训练数据不足。他提出,若构建领域专用数据集——例如将化学分子结构转化为AI可识别格式,有望实现全球前十水平。同时,应更重视可直接部署于实际服务的轻量级模型,而非追求全学科通用能力。

(以上内容均由Ai生成)

引用自:韩国时报

你可能还想读

印军医系统启动首个人工智能糖尿病视网膜病变社区筛查项目

印军医系统启动首个人工智能糖尿病视网膜病变社区筛查项目

快速阅读: 据印度武装部队医疗局消息,12月16日,该机构联合全印医学科学研究所等单位在新德里启动全国首个AI糖尿病视网膜病变社区筛查项目,为6500万糖尿病患者提供早期眼病筛查。项目依托“MadhuNetrAI”平台,由基层医护人员使用手 […]

发布时间:2025年12月17日
印度初创Digantara融资5000万美元推进天基导弹防御

印度初创Digantara融资5000万美元推进天基导弹防御

快速阅读: 据多方确认,印度空间监视企业Digantara完成5000万美元B轮融资,将拓展导弹跟踪业务,以应对全球天基防御需求上升。该公司依托自研传感器技术,已获得美国太空司令部合同,并计划两年内发射15颗卫星,同时扩建在印度、美国和欧洲 […]

发布时间:2025年12月17日
Adobe发布Firefly精准AI视频编辑工具

Adobe发布Firefly精准AI视频编辑工具

快速阅读: 据消息指出,Adobe推出新一代AI视频编辑工具,依托Firefly平台整合多家模型,支持自然语言提示词编辑与跨模型调整,以解决AI生成内容“幻觉”问题,并开放介于基础剪辑与Premiere Pro之间的公开测试版,推动一站式创 […]

发布时间:2025年12月17日
12月值得买入的两只AI股票

12月值得买入的两只AI股票

快速阅读: 据行业统计,受甲骨文与博通财报疲软拖累,AI概念股普遍回调,部分优质标的估值回归合理区间。澳大利亚企业Iren股价较11月高点腰斩,但该公司已获得微软97亿美元合作订单,并聚焦可再生能源数据中心;Alphabet则凭借稳健现金流 […]

发布时间:2025年12月17日
CIO预测2026年AI将重塑企业 workforce 策略

CIO预测2026年AI将重塑企业 workforce 策略

快速阅读: 公开资料显示,受监管不统一与经济压力影响,2025年企业技术高管虽聚焦AI应用以推动增长,但CIO对投入持审慎态度。智能体AI虽引发关注,成功案例仍少,预计2026年将在部分场景从概念走向实践,但大规模落地仍面临部署复杂与效果不 […]

发布时间:2025年12月17日
迪拜千禧大酒店发布AI节日短片

迪拜千禧大酒店发布AI节日短片

快速阅读: 媒体注意到,迪拜Grand Millennium酒店近日推出AI生成节日短片《以孩童之眼观节庆》,通过儿童视角唤起节日温情,强化品牌亲和力。影片在多平台传播效果显著,Instagram获1.6万次曝光,领英达3.8万次曝光,并引 […]

发布时间:2025年12月17日
AI重建古罗马场景被曝充斥史实错误

AI重建古罗马场景被曝充斥史实错误

快速阅读: 消息人士透露,一段AI生成的古罗马视频因包含现代建筑和时代错置的装饰等史实错误,引发学者批评。法国波尔多蒙田大学教授库尔迪指出,该内容虽视觉逼真,却严重背离考古证据,恐误导公众对历史的认知。 近日,一段名为《古罗马|AI生成视频 […]

发布时间:2025年12月17日
Applied Digital股价暴跌17% 因AI数据中心债务风险

Applied Digital股价暴跌17% 因AI数据中心债务风险

快速阅读: 截至今日,受AI数据中心扩张推动,Applied Digital子公司于11月发行23.5亿美元高息票据,用于支持项目及偿债,但其偿债能力高度依赖核心租户CoreWeave,存在较大风险。 受人工智能数据中心业务快速扩张影响,A […]

发布时间:2025年12月17日