AI

黄仁勋预言成真,AI智能体成GitHub主力,一天顶人类一年

发布时间:2025年8月6日    来源:szf
黄仁勋预言成真,AI智能体成GitHub主力,一天顶人类一年

快速阅读: 加拿大女王大学研究揭示AI编程智能体大规模渗透开源社区,如OpenAI Codex、GitHub Copilot等,已作为“AI程序员”参与代码修改、评审,效率大幅提升,但代码接受率仍低于人类。研究提出未来发展方向,包括动态评测、智能评审等。

最近,来自加拿大女王大学的一项最新研究,首次揭示了AI编程智能体如何大规模渗透开源社区。

论文地址:https://arxiv.org/abs/2507.15003 数据集地址:https://huggingface.co/datasets/hao-li/AIDev 代码地址:https://github.com/SAILResearch/AI_Teammates_in_SE3 研究团队通过分析45.6万条GitHub Pull Request(PR,代码修改请求)发现,OpenAI Codex、GitHub Copilot和Claude Code等AI 编程智能体 已超越简单的代码补全角色,正作为 真正的「AI程序员」 活跃在开源一线: 它们能独立发起PR、参与评审,甚至与人类开发者就修改方案展开「讨论」。

这标志着软件工程正式迈入知名AI科学家Andrej Karpathy所预言的3.0时代—AI从工具升级为协作伙伴,全球已有超过6.1万个开源项目开始接纳AI编程智能体作为「同事」。

这些项目涵盖各种规模,使用者包括4.7万名人类开发者。

其中,OpenAI Codex表现最为活跃,提交PR达41万次(截止发文已达到80万次),堪称「卷王」;Devin和GitHub Copilot分别以2.4万和1.6万次提交紧随其后。

效率爆炸:3天干完3年的活 AI编程智能体带来的效率提升令人咋舌。数据显示,GitHub Copilot平均仅需13分钟就能完成一个代码修改请求的核心工作,远快于人类开发者通常所需的数小时甚至数天。

更极端的案例显示,一位开发者借助OpenAI Codex在短短3天内提交了164次代码修改, 几乎相当于他过去3年(提交176次)的工作总量 。

这如同为每位程序员配备了100个不知疲倦的实习生,他们可以24小时不间断地产出代码。

质量困境:快不等于好 研究揭示了一个关键矛盾: AI代码的接受率普遍低于人类 。

OpenAI Codex的代码合并率为65%,GitHub Copilot仅为38%,而人类开发者平均达到76%。

这种差距在核心功能开发中尤为明显:在核心功能开发(feat)和缺陷修复(fix)任务中,差距尤为显著(低15-40个百分点)。

不过,AI在文档编写(docs)方面展现出独特优势。OpenAI Codex的文档类修改接受率高达88.6%,显著超过人类的76.5%。研究推测,文档生成更依赖语言能力而非复杂逻辑推理,这正契合当前大语言模型的核心优势。

更具启发性的现象是,高达37%的GitHub Copilot PR经历了「人机联合评审」——AI工具进行初步筛查后,再由人类把关。

然而,新模式也引发担忧:研究发现,Copilot提交的代码通常由其「同门」AI 智能体(copilot-swe-agent[bot])初审,存在「自己人审自己人」的潜在审查盲点。研究团队建议,未来应探索建立更独立的评审机制以保障公正性。

未来已来:GitHub进化为AI训练场 研究预言,开源平台将进化为AI智能体的「训练健身房」。每一次成功的代码合并将成为强化学习的「正反馈」,每一次测试失败或PR被拒则是宝贵的「负反馈」。

其终极目标是培育出能独立、可靠完成软件迭代的成熟AI程序员。

基于海量实证数据,研究团队为AI编程智能体时代勾勒出关键发展方向: 1. 动态评测体系:摒弃传统的静态测试,直接在真实项目环境中评估AI表现 2. 失败模式解析:深入分析被拒PR,建立AI常见错误库,驱动改进 3. 延迟优化:重点解决部分任务响应超时(>1小时)的长尾问题。

4. 评审减负:让AI生成的代码更清晰、更易审查,降低人类负担 5. 专业评审AI:开发专门用于代码审查的智能体 6. 智能评审分流: 根据代码复杂度与风险自动分配评审资源 7. 全周期质量追踪:监控AI生成代码的长期维护成本和缺陷率 8. 需求理解:提升AI对不明确任务意图的理解与规划能力 9. 编程语言优化:针对TypeScrip等AI擅长语言进行深度适配,或开发出AI专用新语言 「这并非取代人类开发者,而是重新定义开发者的核心角色,未来的程序员将更像交响乐团的指挥家,专注于战略目标设定、协调多个‘AI乐手’的协作,而非亲自演奏每一个音符。」 随着AI编程智能体数量和能力呈指数级增长,软件工程行业正站在深刻变革的临界点。这场革命将如何重塑开发流程、团队协作乃至行业生态,值得我们持续关注与思考。

参考资料: https://arxiv.org/abs/2507.15003 本文来自微信公众号 “新智元” ,作者:新智元,编辑:LRST,36氪经授权发布。

(以上内容均由Ai生成)

你可能还想读

韩半导体出口创纪录,AI芯片繁荣掩盖改革风险

韩半导体出口创纪录,AI芯片繁荣掩盖改革风险

快速阅读: 韩国今年半导体出口预计超1650亿美元,前九月已达1197亿美元,同比增长17%,占总出口23%。增长因人工智能服务器需求和内存价格上涨,在全球经济放缓中展现韧性。 据韩国贸易、工业和资源部本周消息,今年韩国半导体出口预计将达到 […]

发布时间:2025年10月24日
纽约消防局启用AI摄像头,提前预警森林火灾

纽约消防局启用AI摄像头,提前预警森林火灾

快速阅读: 纽约市消防局推出太阳能驱动、AI支持的烟雾检测摄像头,可在火势蔓延前及时发现火灾,计划扩展至五个行政区,增强早期预警能力,保护高风险区域安全。 纽约市消防局(FDNY)的灌木火灾特遣队最近推出了最新的太阳能驱动、人工智能支持的烟 […]

发布时间:2025年10月24日
谷歌云TPU助力Anthropic扩大Claude训练规模

谷歌云TPU助力Anthropic扩大Claude训练规模

快速阅读: Anthropic与Google深化合作,扩大计算能力,支持Claude满足快速增长的客户需求,巩固行业领先位置。 Anthropic 和 Google 有着长期的合作关系,此次合作的进一步扩展将帮助我们继续扩大所需的计算能力, […]

发布时间:2025年10月24日
中兴呼吁重耦合计算与网络,推动AI可持续发展

中兴呼吁重耦合计算与网络,推动AI可持续发展

快速阅读: 中兴通讯CEO徐子阳呼吁电信与计算行业重新耦合,以适应AI需求增长,提出AI Core战略,展示多款支持AI的产品,强调可持续发展与成本控制,与泰国AIS合作提升网络效率。 近年来,电信和计算行业纷纷采取解耦策略,通过技术与产品 […]

发布时间:2025年10月24日
微软推出新AI角色Mico,赋予Copilot虚拟助手新面貌

微软推出新AI角色Mico,赋予Copilot虚拟助手新面貌

快速阅读: 微软推出新AI角色Mico,作为Copilot虚拟助手的化身,旨在为AI聊天机器人增添个性,同时保持友好而不谄媚的形象,通过表情和动作响应用户情绪,目前仅限美国用户使用。 近三十年前令微软Office用户感到厌烦的动画纸夹Cli […]

发布时间:2025年10月24日
英特尔Q3营收137亿美元,同比增长3%成功扭亏为盈

英特尔Q3营收137亿美元,同比增长3%成功扭亏为盈

快速阅读: 英特尔公布2025年第三季度财报,营收137亿美元,同比增长3%,毛利率达38.2%。各业务部门表现不一,CCG营收增长5%,DCAI和代工业务略有下降。期间获多笔重大投资,推进技术创新和市场扩展。 感谢IT之家网友HH_KK、 […]

发布时间:2025年10月24日
微软推出AI伴侣Mico,致敬经典Clippy大眼夹

微软推出AI伴侣Mico,致敬经典Clippy大眼夹

快速阅读: 微软推出AI聊天机器人Mico,具有表情丰富的头像,能倾听互动并根据用户操作变换颜色。首次在美国、加拿大和英国推出,支持“Learn Live”模式,旨在加深人际联系。 10 月 24 日消息,北京时间今天凌晨,微软推出了一款名 […]

发布时间:2025年10月24日
英特尔107制程产能紧张,AI PC出货预期不变

英特尔107制程产能紧张,AI PC出货预期不变

快速阅读: 英特尔在2025Q3财报电话会议中宣布,Intel 10/7制程节点供应紧张,尽管第三季度晶圆交付量超出预期,仍无法满足客户需求。英特尔计划利用现有库存并引导客户转向其他产品,预计2026年一季度供应更紧。同时,英特尔维持年底前 […]

发布时间:2025年10月24日