瑞士推出完全开源AI大模型Apertus,覆盖千种语言
快速阅读: 瑞士推出首个完全开源大语言模型Apertus,由EPFL、ETH Zurich及CSCS联合研发,支持超1000种语言,强调透明开放原则,旨在替代国际AI方案,促进科研与创新。
在全球人工智能技术快速发展的背景下,瑞士近日正式推出了其首个完全开源的大语言模型——Apertus。该模型由瑞士联邦理工学院(EPFL)、苏黎世联邦理工学院(ETH Zurich)及国家超级计算中心(CSCS)联合研发,标志着瑞士在人工智能领域的自主创新能力取得了重要进展。
作为瑞士国家级的大语言模型,Apertus具备多语言处理能力,涵盖超过1000种语言,其中40%的数据源自非英语语言。这一特性不仅增强了对多元文化的包容性,还使Apertus能更好地满足瑞士国内的特殊语言需求,如瑞士德语和罗曼什语等。其开放设计旨在为用户提供一个可以替代OpenAI等国际大公司AI解决方案的选项。
值得一提的是,Apertus的开发过程中充分体现了透明和开放的原则。除了公开模型权重外,研发团队还公布了模型架构、训练数据和训练流程等信息,并采用了宽松的开源许可,支持教育、科研及商业用途。此举大大降低了用户的使用门槛,使更多科研人员和开发者能够参与人工智能的创新活动。
Apertus的训练依赖于瑞士的“Alps”超级计算机,该计算机配置了超过1万颗NVIDIA Grace Hopper GPU,并使用可再生能源,体现了对可持续发展的承诺。据研发团队介绍,Apertus提供了两个版本:一个是参数量为80亿的版本,适用于个人用户和轻量级应用;另一个是参数量达700亿的版本,专为复杂场景设计。
目前,用户可通过Swisscom平台、Hugging Face及Public AI Network等渠道获取Apertus。瑞士政府希望通过该项目,将人工智能建设成为公共基础设施,强调其合规性、透明度和普惠价值,以促进科研、教育和产业的创新能力提升。
(以上内容均由Ai生成)