瑞士发布Apertus开源模型,全面公开AI训练细节
快速阅读: 瑞士多所科研机构联合发布名为Apertus的大规模开源语言模型,公开模型权重、架构、训练代码等所有信息,以促进全球合作与创新,推动AI研究开放性与可复现性。
瑞士的科研机构正在联手挑战大型语言模型的“黑箱”现状。
瑞士联邦理工学院洛桑分校(EPFL) 、**苏黎世联邦理工学院(ETH Zurich) 以及 瑞士国家 超级 计算中心(CSCS)**近日发布了一款名为 Apertus 的大规模开源语言模型。该模型不仅在名称上——拉丁语意为“开放”——彰显了其核心理念,更在实践中将“开放”做到了 极致 。
与OpenAI的GPT系列、Meta的Llama以及Anthropic的Claude等美国主流模型不同,Apertus以其 史无前例 的透明度脱颖而出。它公开了从 模型权重、架构、训练代码、数据配方 ,到 完整的训练过程文档 的所有关键信息,毫不保留。这种完全透明的发布方式,旨在促进全球范围内的合作与创新,让研究人员和开发者能够深入理解模型的工作原理,并在此基础上进行改进与优化。
Apertus的发布,标志着瑞士在推动人工智能研究开放性与可复现性方面迈出了重要一步,为行业树立了新的标杆。
(以上内容均由Ai生成)