研究显示:代码生成AI短期内不会取代人类开发者

发布时间:2025年11月4日    来源:szf
研究显示:代码生成AI短期内不会取代人类开发者

快速阅读: 研究显示,编码代理在人类指导下表现最佳,缺乏指导时推理能力下降。AI编码需人类监督以保证代码质量、安全性和可维护性,沃尔玛等企业采用混合策略,结合AI与人类开发者优势,提高效率和可扩展性。

研究结果显示,编码代理能够在受控环境中高效生成和优化代码,但一旦缺乏人类指导,其推理能力就会下降。研究人员认为,这种下降归因于缺少上下文和目标不明确,而这些问题通常由人类开发者通过判断和领域经验自然解决。“这些系统可以进行多步骤推理,但没有结构化的反馈,它们无法区分正确性和可能性。”作者写道。

《彭博社观点》专栏警告称,“氛围编码革命”被过度炒作,认为许多AI构建的程序仍需大量重做才能达到生产标准。“氛围编码”这一术语最初由AI研究员安德烈·卡帕西提出,描述了一种趋势,即通过自然语言提示模型来编写和运行整个应用程序,无需了解每行代码。它承诺加快软件创建速度,但也引发了关于控制、版本管理和责任的新问题。

实际上,研究人员发现,像克劳德、光标和SWE-Agent这样的代理模型在开发者在关键检查点审查输出时表现最佳,而非完全自主运行。没有这些检查点,模型产生的代码库更长、可维护性差,并且忽略了安全约束。这些发现与早期关于《CoAct-1:以编码为行动的计算机使用代理》的研究结论一致,后者同样得出结论,人类互动对于引导多代理软件系统走向可靠结果至关重要。

《华尔街日报》报道显示,全球最大的企业软件买家之一沃尔玛,并未用AI代理取代其开发者,而是同时扩大了两者规模。该零售商正在创造新的“代理开发者”角色,即训练、监督并将编码代理整合到生产工作流程中的工程师。沃尔玛的战略不是将人类排除在外,而是将传统开发者与管理文档、代码重构和测试自动化的AI副驾配对。同样的混合方法在金融、物流和零售行业的企业战略中也有体现。人类开发者越来越多地充当代理系统的指挥者,构建上下文、实施验证并维持业务逻辑与机器输出之间的连续性。这是“交互自主”,其中AI执行任务,人类进行验证。这种组合提高了速度和可扩展性,同时保留了合规性和可维护性所需的关键人类判断。

“氛围编码”也为小企业创造了机会,这些企业可能之前无力支付整个开发团队的费用。例如,贾斯汀·金在推出AI驱动的娱乐应用Giggles时的经历就是如此。然而,研究人员警告说,这种结构必须是有意为之。人类与代理之间无结构的合作可能会减慢工作进度,而不是加速。研究中那些采用了固定审查点和角色定义的团队比让代理独立操作的团队准确率高出31%。作者认为,没有框架支持的自主性会引入低效而非创新。

正如斯坦福大学的“打击”论文所指出的,未经监控的AI代码可能在大规模上引入安全和合规漏洞。无论是在研究还是行业中,教训都是,AI编码的自主性不是一个终点,而是一个设计选择。真正的效率在于引导代理的反馈架构,将人类推理、伦理监督和情境理解嵌入每个迭代中。

“氛围编码”或许确实能激发新经济,但并非通过完全自动化实现。其真正潜力在于重新定义合作:管理、教学和纠正AI的开发者将塑造下一个软件创作时代。在这个过程中,编码可能不再只是关于语法,而更多是关于一种共享的工作流程,其中人类监督仍然存在。

(以上内容均由Ai生成)

你可能还想读

校园安防技术效果存疑

校园安防技术效果存疑

快速阅读: 据校园安全杂志报道,布朗大学12月13日发生枪击事件,造成2人死亡、9人受伤,校方计划升级门禁与监控系统;专家质疑包括AI武器识别在内的40亿美元校园安防技术缺乏实证,强调“就地封锁”等基础应急措施更为有效。 2025年12月1 […]

发布时间:2025年12月19日
谷歌Gemini推绘图编辑与AI视频验证功能

谷歌Gemini推绘图编辑与AI视频验证功能

快速阅读: 据不完全统计,谷歌近日更新Gemini应用,新增图像标记指令功能,并将SynthID技术扩展至视频领域,以提升AI生成内容的可验证性与透明度,回应社会对生成式AI溯源的关切。 谷歌近日对Gemini应用推出两项更新,旨在提升用户 […]

发布时间:2025年12月19日
多模型协作提升智能合约审计效果

多模型协作提升智能合约审计效果

快速阅读: 据媒体报道,佐治亚理工学院团队提出LLMBugScanner框架,通过集成多个微调大语言模型协同检测以太坊智能合约漏洞,在108份真实合约测试中将准确率提升至约60%,显著优于单模型方案,为区块链安全审计提供新路径。 智能合约漏 […]

发布时间:2025年12月19日
商汤ACE机器人发布三大技术加速具身AI落地

商汤ACE机器人发布三大技术加速具身AI落地

快速阅读: 记者从商汤科技获悉,其旗下ACE Robotics于近日发布ACE具身研发范式、开源世界模型Kairos 3.0及A1具身超脑模块,构建全栈技术链路,支持115个行业场景,推动具身智能产业化发展。 2025年12月18日,商汤科 […]

发布时间:2025年12月19日
火山引擎发布豆包大模型1.8跻身全球多模态AI第一梯队

火山引擎发布豆包大模型1.8跻身全球多模态AI第一梯队

快速阅读: 据火山引擎消息,该公司在12月18日FORCE原动力大会上发布豆包大模型1.8及Seedance 1.5 Pro音视频模型。前者多模态能力全球领先,日均Token使用量突破50万亿;后者支持毫秒级音画同步与方言识别,企业用户可于 […]

发布时间:2025年12月19日
AI预测2026年全球趋势

AI预测2026年全球趋势

快速阅读: 最新消息显示,受传统智慧与现代趋势影响,2026年将聚焦调适与深耕;商业领域强调协作与绿色转型,地缘政治注重文化互信,体育及文化艺术则推崇平衡、真诚与内在力量。 2026年将是一个充满变革与机遇之年。受多重传统智慧视角启发,各方 […]

发布时间:2025年12月19日
奥里萨邦举办区域AI峰会聚焦可持续未来

奥里萨邦举办区域AI峰会聚焦可持续未来

快速阅读: 12月19日消息,印度奥里萨邦在布巴内斯瓦尔启动“2025区域人工智能影响力峰会”,聚焦可持续AI发展与政府治理应用。作为全国首个出台AI政策的地区,该邦正通过“奥里萨AI使命”推动AI在医疗、教育等场景落地,并加强本土人才培养 […]

发布时间:2025年12月19日
IBM将培训500万印度青年掌握AI等前沿技术

IBM将培训500万印度青年掌握AI等前沿技术

快速阅读: 据IBM公司消息,该公司将在印度启动大规模技能发展计划,目标到2030年为500万学习者提供人工智能、网络安全和量子计算等前沿技术培训,依托SkillsBuild平台推动数字教育普惠,并与全印技术教育委员会合作开展课程融合与师资 […]

发布时间:2025年12月19日