Skip to content
数智风暴 首页 AI军事时政社会科技航天
登录

标签: 强化学习

  • DeepSeek-R1登Nature封面,强化学习提升AI推理能力

    快速阅读: 梁文锋教授团队研发的DeepSeek-R1模型,通过强化学习提升大型语言模型的推理能力,成为首个经权威学术期刊同行评审的语言模型,强调训练透明性和安全性,获学术界高度评价。 近日,《Nature》杂志的 最新 一期封面论文引起了 […]

    发布时间:2025-09-18 16:29    来源:szf
    DeepSeek-R1登Nature封面,强化学习提升AI推理能力
  • 机器人学会用强化学习塑造沙子

    快速阅读: 波恩大学研发的强化学习框架使机器人能精准塑造沙子等颗粒材料,达到毫米级精度。该系统在多种基准测试中表现优异,无需额外训练即可从模拟环境迁移到实际应用。 一项发表在arXiv上的研究详细介绍了波恩大学研究人员开发的一种强化学习框架 […]

    发布时间:2025-09-15 21:28    来源:szf
    机器人学会用强化学习塑造沙子
  • 英伟达用“人类考官”测试AI,强化学习提升模型常识

    快速阅读: 通过教师测试学生式的反馈机制检验AI,即强化学习,经多轮测试及严格质量保证,目标使模型掌握物理世界知识。 通过类似教师测试学生的反馈机制来检验AI,这种学习方法被称为强化学习。经过多轮测试,以及数据工厂团队领导与Cosmos R […]

    发布时间:2025-09-02 19:10    来源:szf
    英伟达用“人类考官”测试AI,强化学习提升模型常识
  • 科学家Andrej Karpathy长期看衰强化学习

    快速阅读: 知名AI研究员安德烈·卡帕西对强化学习持悲观态度,认为其效率低且难以设计,未来将被更高效的学习方法取代。卡帕西曾参与GPT-4研发,相信新方法将模拟人类思维。 知名AI研究员、前OpenAI科学家安德烈·卡帕西在X平台上表示,他 […]

    发布时间:2025-08-29 17:05    来源:szf
    科学家Andrej Karpathy长期看衰强化学习
  • GEPA优化大模型,无需昂贵强化学习

    快速阅读: 加州大学伯克利分校、斯坦福大学和Databricks推出GEPA,优化大型语言模型适应特定任务,比传统强化学习效率高35倍,降低成本,提高准确性,帮助企业快速开发复杂AI系统。 加州大学伯克利分校、斯坦福大学和 Databric […]

    发布时间:2025-08-19 18:54    来源:szf
    GEPA优化大模型,无需昂贵强化学习

文章分类

  • AI (6545)
  • IT (2750)
  • 产业链 (97)
  • 军事 (17235)
  • 军工产业 (577)
  • 军用通信 (153)
  • 医药 (3517)
  • 商业 (323)
  • 外交 (19901)
  • 战略建设 (791)
  • 投资 (960)
  • 政治 (1537)
  • 教育 (1)
  • 文化 (44101)
  • 无人装备 (16)
  • 无人装备 (2225)
  • 时政 (846)
  • 智能系统 (424)
  • 未分类 (136)
  • 武器装备 (1258)
  • 硬件 (3)
  • 社会 (37908)
  • 科技 (44560)
  • 经济 (10098)
  • 航天 (4247)
  • 行业应用 (1839)
  • 软件 (8)

归档日期

  • 2025 年 10 月 (2764)
  • 2025 年 9 月 (4947)
  • 2025 年 8 月 (4589)
  • 2025 年 7 月 (11314)
  • 2025 年 6 月 (3875)
  • 2025 年 5 月 (7213)
  • 2025 年 4 月 (12780)
  • 2025 年 3 月 (16036)
  • 2025 年 2 月 (8032)

热门关键词

    AI (19496)无人机 (9362)乌克兰 (3047)Openai (1651)袭击 (1585)2025 (1538)Google (1255)特朗普 (1152)Chatgpt (1083)俄罗斯 (1040)

© 2025 成都数智风科技有限公司. All rights reserved.