GSMA Open-Telco LLM 基准测试推出,推动电信 AI 发展

发布时间:2025年2月25日    来源:szf
GSMA Open-Telco LLM 基准测试推出,推动电信 AI 发展

快速阅读: 据《GSMA 公司》称,2025年2月25日,GSMA宣布推出开放电信大语言模型基准测试,旨在提升电信领域AI模型性能。该计划获得了多家移动网络运营商和技术供应商支持,包括德国电信、LG Uplus、SK电信和华为等。此举将填补当前AI模型在电信应用中的局限,通过透明的开源评估方法提高模型的能力、能效和安全性。

2025年2月25日,伦敦 —— GSMA创新中心今日宣布推出GSMA开放电信大语言模型基准测试,这是一个旨在提升电信专用应用程序中大型语言模型(LLM)性能的开源社区。该社区提供了业界首个框架,用于评估实际电信使用场景中的AI模型,并在启动时得到了Hugging Face、卡尔巴大学、Linux基金会以及众多领先移动网络运营商和技术供应商的支持。

随着电信领域对AI的采用加速,LLM在处理技术性电信知识、监管合规性和网络故障排除方面表现出显著不足。最近的测试显示,GPT-4在TeleQnA上的得分低于75%,TeleQnA是一个全面的数据集,专门用于评估LLM在电信领域的知识;在基于3GPP标准文档的3GPPTdocs分类数据集上,GPT-4得分低于40%。微软的Phi-2,一个更小的模型,在包含500个通用数学问题的MATH500基准测试中仅得10分。

这些结果突显了当前AI模型在解决特定电信查询方面的局限性。GSMA开放电信大语言模型基准测试将通过透明且开源的评估方法来填补这些空白,涵盖能力、能效和安全性。

“今天的AI模型在处理特定电信查询时存在困难,经常产生不准确、误导或不切实际的建议,”GSMA AI项目负责人路易斯·鲍威尔表示。“通过创建一套行业标准基准,我们不仅提高了模型的性能,还确保了电信领域的AI是安全、可靠并符合实际运营需求的。”

支持GSMA开放电信大语言模型基准测试发布的移动网络运营商包括德国电信、LG Uplus、SK电信和Turkcell,以及技术供应商华为。

GSMA开放电信大语言模型基准测试社区使移动网络运营商、AI研究人员和开发者能够提交使用案例、数据集和模型进行评估。标准化的基准测试框架确保所有AI模型都在电信领域知识、数学推理、能耗和安全性等现实世界挑战下进行评估。最终的基准测试结果将在Hugging Face上发布,以确保透明度并鼓励社区参与。

现在,移动网络运营商、供应商、初创企业和研究人员被鼓励通过提交兴趣和LLM电信用例到 [email protected] 来贡献内容,并访问 www.gsma.com/get-involved/gsma-foundry/gsma-open-telco-llm-benchmarks 获取更多信息。

合作伙伴引言:

Hugging Face

Hugging Face产品与增长主管杰夫·布迪耶表示:“Hugging Face是领先的AI构建者开源平台,我们很高兴支持并托管GSMA开放电信大语言模型基准测试,以促进电信AI的采用和创新。”

卡尔巴大学

“学术界通过确保严格的基准测试和科学诚信,在推动电信领域的AI发展中发挥着关键作用。在卡尔巴大学,我们很自豪地支持GSMA开放电信大语言模型基准测试倡议。这一努力将推动创新并提高AI模型在实际电信应用中的可靠性,”卡尔巴大学6G研究中心主任梅鲁安·德巴赫教授说。

LG Uplus

LG Uplus首席技术官李尚燮表示:“我们正处于一个人类和AI代理共存的新阶段,而电信将在建立他们之间安全自主连接中扮演重要角色。LG Uplus致力于通过LLM的发展推进AI代理创新,并欢迎GSMA开放电信大语言模型基准测试作为我们追求保障智能服务的指路明灯。”

Linux基金会

“GSMA开放电信大语言模型基准测试的发布标志着电信行业推动AI采用的一个重要里程碑,”Linux基金会网络、边缘和物联网部门总经理阿普里特·乔希普拉说。“通过建立开放的标准基准,这一举措带来了急需的透明度和性能洞察,使运营商和生态系统合作伙伴能够在部署特定领域的AI时充满信心。Linux基金会支持这一努力,因为它与我们推动全球电信网络创新和效率的愿景相一致。”

SK电信

SK电信AI技术合作办公室负责人埃里克·戴维斯表示:“GSMA开放电信大语言模型基准测试的引入标志着电信行业在其追求实际AI效益过程中的一个重要里程碑。通过建立标准化的评估框架,我们同时推动了创新并确保AI解决方案能够提供我们的快速演变行业所要求的稳健性、可靠性和精确性。”

此次发布紧随去年全行业承诺以道德和可持续的方式探索电信AI用例,其中核心是GSMA负责任的AI成熟度路线图,这有助于移动网络运营商确保从开始到演进过程中应用最佳实践原则。

MWC25巴塞罗那的“生成式AI峰会:从实验到转型”将举办一系列会议,旨在探索生成式AI在电信行业的实际应用和变革潜力。主要内容将包括关于AI驱动的网络优化、个性化客户体验以及在5G及以后集成生成式AI的讨论。著名演讲嘉宾如英国电信首席数字官哈里·辛格、e&集团首席战略官哈里森·朗、亚马逊AWS工业技术部总监卡尼兹·马赫迪以及Orange首席技术官洛朗·勒布舍,将分享他们关于利用AI推动行业进步的见解和经验。

MWC25巴塞罗那其他AI演讲亮点包括主题演讲7“科技游戏改变者”,亚瑟·门施,一位领先的AI研究员和Mistral AI的CEO,将登台讨论最新的发展和即将革新电信行业的实际应用。此外,主题演讲10“为什么AI代理将改变一切”,布雷特·泰勒,Sierra的CEO和联合创始人以及OpenAI董事会成员,将讨论AI代理如何准备重塑企业和企业。

MWC25巴塞罗那的“生成式AI峰会:从实验到转型”将举办一系列会议,旨在探索生成式AI在电信行业的实际应用和变革潜力。主要内容将包括关于AI驱动的网络优化、个性化客户体验以及在5G及以后集成生成式AI的讨论。著名演讲嘉宾如英国电信首席数字官哈里·辛格、e&集团首席战略官哈里森·朗、亚马逊AWS工业技术部总监卡尼兹·马赫迪以及Orange首席技术官洛朗·勒布舍,将分享他们关于利用AI推动行业进步的见解和经验。

-ENDS-

致编辑的注释

[1] https://arxiv.org/abs/2303.08774

2 https://arxiv.org/abs/2310.15051

[1] https://arxiv.org/abs/2303.08774

3 https://huggingface.co/datasets/netop/TeleQnA

4 https://arxiv.org/pdf/2407.09424

5 https://www.microsoft.com/en-us/research/blog/phi-2-the-surprising-power-of-small-language-models/

6 https://huggingface.co/datasets/di-zhang-fdu/MATH500

7 https://arxiv.org/pdf/2103.03874

附加感兴趣的论文,“TelcoLM:为电信领域收集数据、适应和基准测试语言模型”,康奈尔大学,2024年12月

关于GSMA

GSMA是一个统一移动生态系统的全球组织,旨在发现、开发和交付对积极商业环境和社会变革具有基础性的创新。我们的愿景是释放连接的全部力量,使人们、产业和社会繁荣发展。代表移动运营商和移动生态系统及其相邻行业的组织,GSMA在三大支柱上为会员提供服务:公益连接、行业服务和解决方案以及外展活动。这些活动包括推进政策、应对当今最大的社会挑战、支持使移动通信工作所需的技术和互操作性,并提供世界上最大的平台,让移动生态系统在MWC和M360系列活动中汇聚一堂。

关于GSMA

欢迎您了解更多详情,请访问 gsma.com

关于GSMA

媒体联系人

GSMA新闻团队

[email protected]

(以上内容均由Ai生成)

关键词: AiGsmaLlmOpenTelco

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日