Nous Research发布Hermes 4 AI模型,性能超越ChatGPT无内容限制
快速阅读: 人工智能初创公司Nous Research推出Hermes4大型语言模型,性能与商业系统相当,数学测试中表现更佳,提供更高用户控制权和透明度,采用DataForge和Atropos创新训练系统,增强开放源代码AI竞争力。
人工智能初创公司Nous Research近日推出Hermes4系列大型语言模型。该公司表示,Hermes4的性能与当前领先的商业系统相当,甚至在数学基准测试中表现更佳,同时提供了更高的用户控制权和内容限制。
Hermes4的推出标志着开放源代码AI倡导者与大型科技公司之间的竞争更加激烈。与OpenAI、谷歌或Anthropic的模型不同,Hermes4设计上几乎可以回应所有请求,而没有商业AI系统常见的安全防护。
Nous Research在社交平台上宣布,Hermes4基于用户导向的模型构建,扩展了测试时的计算能力,专注于提高模型的创造性和趣味性,同时保持数学、编程和推理的表现,去除了审查。
新模型引入了“混合推理”模式,用户可以根据需求选择快速响应或更深入的逐步思考。开启此模式时,模型会生成思考过程,并在特殊标签内显示,最后给出最终答案。这种透明的思维过程与OpenAI的o1推理模型类似,但在信息透明度上更进一步。
在最新测试中,Hermes4的最大模型以4050亿参数在MATH-500基准测试中获得96.3%的得分,在AIME’24数学竞赛中得分达到81.9%。这些表现与许多昂贵的商业系统不相上下。
在技术实现上,Nous Research采用了两个创新系统进行模型训练:DataForge和Atropos。DataForge通过图形生成合成数据,将简单的预训练数据转化为复杂的指令跟随实例。Atropos则是一个开源的强化学习框架,提供数百个专门的训练环境,使AI模型能够练习特定技能。
Hermes4的发布正值人工智能行业的重要时刻,随着开放源代码运动的兴起,越来越多的模型开始在性能上与商业系统竞争。Nous Research的成功展示了小型初创公司在与大科技公司抗衡时的创新能力。
Hermes4的发布不仅是一项技术成就,更是对人工智能未来控制权的重新思考。Nous Research坚持用户透明和控制的理念,未来将对行业产生深远影响。
(以上内容均由Ai生成)