标签: 强化学习
-
DeepSeek-R1登Nature封面,强化学习提升AI推理能力
快速阅读: 梁文锋教授团队研发的DeepSeek-R1模型,通过强化学习提升大型语言模型的推理能力,成为首个经权威学术期刊同行评审的语言模型,强调训练透明性和安全性,获学术界高度评价。 近日,《Nature》杂志的 最新 一期封面论文引起了 […]
发布时间:2025-09-18 16:29 来源:szf -
机器人学会用强化学习塑造沙子
快速阅读: 波恩大学研发的强化学习框架使机器人能精准塑造沙子等颗粒材料,达到毫米级精度。该系统在多种基准测试中表现优异,无需额外训练即可从模拟环境迁移到实际应用。 一项发表在arXiv上的研究详细介绍了波恩大学研究人员开发的一种强化学习框架 […]
发布时间:2025-09-15 21:28 来源:szf -
英伟达用“人类考官”测试AI,强化学习提升模型常识
快速阅读: 通过教师测试学生式的反馈机制检验AI,即强化学习,经多轮测试及严格质量保证,目标使模型掌握物理世界知识。 通过类似教师测试学生的反馈机制来检验AI,这种学习方法被称为强化学习。经过多轮测试,以及数据工厂团队领导与Cosmos R […]
发布时间:2025-09-02 19:10 来源:szf -
科学家Andrej Karpathy长期看衰强化学习
快速阅读: 知名AI研究员安德烈·卡帕西对强化学习持悲观态度,认为其效率低且难以设计,未来将被更高效的学习方法取代。卡帕西曾参与GPT-4研发,相信新方法将模拟人类思维。 知名AI研究员、前OpenAI科学家安德烈·卡帕西在X平台上表示,他 […]
发布时间:2025-08-29 17:05 来源:szf -
GEPA优化大模型,无需昂贵强化学习
快速阅读: 加州大学伯克利分校、斯坦福大学和Databricks推出GEPA,优化大型语言模型适应特定任务,比传统强化学习效率高35倍,降低成本,提高准确性,帮助企业快速开发复杂AI系统。 加州大学伯克利分校、斯坦福大学和 Databric […]
发布时间:2025-08-19 18:54 来源:szf