研究显示:代码生成AI短期内不会取代人类开发者

发布时间:2025年11月4日    来源:szf
研究显示:代码生成AI短期内不会取代人类开发者

快速阅读: 研究显示,编码代理在人类指导下表现最佳,缺乏指导时推理能力下降。AI编码需人类监督以保证代码质量、安全性和可维护性,沃尔玛等企业采用混合策略,结合AI与人类开发者优势,提高效率和可扩展性。

研究结果显示,编码代理能够在受控环境中高效生成和优化代码,但一旦缺乏人类指导,其推理能力就会下降。研究人员认为,这种下降归因于缺少上下文和目标不明确,而这些问题通常由人类开发者通过判断和领域经验自然解决。“这些系统可以进行多步骤推理,但没有结构化的反馈,它们无法区分正确性和可能性。”作者写道。

《彭博社观点》专栏警告称,“氛围编码革命”被过度炒作,认为许多AI构建的程序仍需大量重做才能达到生产标准。“氛围编码”这一术语最初由AI研究员安德烈·卡帕西提出,描述了一种趋势,即通过自然语言提示模型来编写和运行整个应用程序,无需了解每行代码。它承诺加快软件创建速度,但也引发了关于控制、版本管理和责任的新问题。

实际上,研究人员发现,像克劳德、光标和SWE-Agent这样的代理模型在开发者在关键检查点审查输出时表现最佳,而非完全自主运行。没有这些检查点,模型产生的代码库更长、可维护性差,并且忽略了安全约束。这些发现与早期关于《CoAct-1:以编码为行动的计算机使用代理》的研究结论一致,后者同样得出结论,人类互动对于引导多代理软件系统走向可靠结果至关重要。

《华尔街日报》报道显示,全球最大的企业软件买家之一沃尔玛,并未用AI代理取代其开发者,而是同时扩大了两者规模。该零售商正在创造新的“代理开发者”角色,即训练、监督并将编码代理整合到生产工作流程中的工程师。沃尔玛的战略不是将人类排除在外,而是将传统开发者与管理文档、代码重构和测试自动化的AI副驾配对。同样的混合方法在金融、物流和零售行业的企业战略中也有体现。人类开发者越来越多地充当代理系统的指挥者,构建上下文、实施验证并维持业务逻辑与机器输出之间的连续性。这是“交互自主”,其中AI执行任务,人类进行验证。这种组合提高了速度和可扩展性,同时保留了合规性和可维护性所需的关键人类判断。

“氛围编码”也为小企业创造了机会,这些企业可能之前无力支付整个开发团队的费用。例如,贾斯汀·金在推出AI驱动的娱乐应用Giggles时的经历就是如此。然而,研究人员警告说,这种结构必须是有意为之。人类与代理之间无结构的合作可能会减慢工作进度,而不是加速。研究中那些采用了固定审查点和角色定义的团队比让代理独立操作的团队准确率高出31%。作者认为,没有框架支持的自主性会引入低效而非创新。

正如斯坦福大学的“打击”论文所指出的,未经监控的AI代码可能在大规模上引入安全和合规漏洞。无论是在研究还是行业中,教训都是,AI编码的自主性不是一个终点,而是一个设计选择。真正的效率在于引导代理的反馈架构,将人类推理、伦理监督和情境理解嵌入每个迭代中。

“氛围编码”或许确实能激发新经济,但并非通过完全自动化实现。其真正潜力在于重新定义合作:管理、教学和纠正AI的开发者将塑造下一个软件创作时代。在这个过程中,编码可能不再只是关于语法,而更多是关于一种共享的工作流程,其中人类监督仍然存在。

(以上内容均由Ai生成)

你可能还想读

伦敦警方称实时人脸识别技术提升公共安全效益

伦敦警方称实时人脸识别技术提升公共安全效益

快速阅读: 伦敦警察厅报告称,2024年9月至2025年9月LFR技术部署致962次逮捕,超四成涉女性暴力,误报率低至0.0003%。尽管85%居民支持,仍面临公民自由组织批评。警方计划扩大使用。 伦敦警察厅声称,其日益增加的实时面部识别( […]

发布时间:2025年11月4日
图灵研究所开发新工具保护国家关键基础设施

图灵研究所开发新工具保护国家关键基础设施

快速阅读: 图灵研究所开发两款新工具保护英国关键基础设施,包括“烟幕镜像”AI反病毒工具和AI网络风险基准,提升防范高级网络攻击能力。 图灵研究所宣布正在开发两款新的网络工具,旨在保护英国的关键国家基础设施(CNI)。该研究所说,这些工作是 […]

发布时间:2025年11月4日
宫崎骏组织呼吁OpenAI停止使用日本艺术训练AI

宫崎骏组织呼吁OpenAI停止使用日本艺术训练AI

快速阅读: 内容海外发行协会(CODA)代表吉卜力等日本出版商,要求OpenAI停止使用未授权的日本版权内容训练Sora 2,指认其可能侵犯版权,呼吁平衡创新与创作者权益。 近日,模仿宫崎骏工作室吉卜力风格的人工智能生成视频在OpenAI的 […]

发布时间:2025年11月4日
新AI工具虽快却难替代教师的判断与人文关怀

新AI工具虽快却难替代教师的判断与人文关怀

快速阅读: 由于连续强降雨,南部多地区发生洪水,相关部门紧急启动防汛响应,全力应对灾情。 意见:新的人工智能工具虽然快速,但无法替代教师带来的判断力、关怀和文化知识 作者:Tanishia Lavette Williams,《赫钦格报告》 […]

发布时间:2025年11月4日
微软发现利用OpenAI API作隐蔽命令通道的新后门“SesameOp”

微软发现利用OpenAI API作隐蔽命令通道的新后门“SesameOp”

快速阅读: 微软披露新型后门“SesameOp”,利用OpenAI助手API进行隐蔽C2通信,持续数月未被发现,涉及复杂布局和AppDomainManager注入技术,旨在长期访问目标系统进行间谍活动。 微软披露了一种名为“SesameOp […]

发布时间:2025年11月4日
阿里Qwen两周赚22%,击败DeepSeek和OpenAI

阿里Qwen两周赚22%,击败DeepSeek和OpenAI

快速阅读: 阿里巴巴云的Qwen3-Max模型在Nof1的Alpha Arena测试中以22.32%的回报率领先,成为六款中美AI模型中表现最佳之一,其余多数模型亏损,OpenAI的GPT-5跌幅最大。 阿里巴巴集团开发的人工智能模型在一项 […]

发布时间:2025年11月4日
可口可乐AI新版“可乐大篷车”广告遭诟病,但公司坚称“更快更省”

可口可乐AI新版“可乐大篷车”广告遭诟病,但公司坚称“更快更省”

快速阅读: 可口可乐利用AI技术重塑“可乐大篷车”假日广告,引发消费者负面评价,称视觉效果“令人不适”。新广告以动物角色为主,动作不自然,视觉风格混乱。尽管如此,可口可乐认为AI制作成本更低、速度更快。 可口可乐公司再次利用 人工智能生成技 […]

发布时间:2025年11月4日
昆仑万维SkyReels V3上线,聚合顶尖AI视频创作能力

昆仑万维SkyReels V3上线,聚合顶尖AI视频创作能力

快速阅读: 昆仑万维AI视频创作平台SkyReels焕新上线,推出V3模型及五大核心功能升级,提供一站式多模态创作服务,涵盖图片、视频、数字人、音乐生成,满足用户多样化需求。 今日,昆仑万维旗下的AI视频创作平台SkyReels正式宣布焕新 […]

发布时间:2025年11月4日