科学家提出AI辅助编程十项严谨准则

发布时间：2025年12月16日来源：szf

快速阅读: 12月16日消息，科研人员广泛使用AI编程助手以提升效率，但由于科学计算对代码准确性要求极高，缺乏理解易导致结果偏差。专家强调，须严格审查生成代码、明确需求、管理上下文并承担全责，以确保科研可靠性。

近年来，人工智能技术快速发展，大型语言模型在科研编程中的应用日益广泛。神经科学家普遍借助AI工具辅助编写代码，以提升工作效率。然而，科学计算对代码的准确性与可重复性要求极高，若研究人员缺乏对生成代码的深入理解，可能影响科研结论的可靠性。

2022年GitHub Copilot上线，2023年初GPT-4发布后，AI的编码能力显著增强。有分析显示，大模型解决复杂编程问题的能力正以超指数速度提升，性能大约每七个月翻一番。过去一年，具备自主调用外部工具能力的“智能体”编码系统进一步拓展了AI的应用边界。

目前，科研人员主要通过ChatGPT、Claude等聊天机器人，或集成于Visual Studio Code、Cursor等开发环境的AI代理进行编程。理论上，这些工具可加速科研进程，其生成的代码质量常优于普通非专业程序员。但隐患同样突出：研究者容易依赖自身无法充分理解的代码，既增加调试难度，也削弱对关键科学基础设施的质量把控。

今年10月，相关学者在预印本中提出“科研中使用AI编程助手的十条准则”，强调领域知识仍不可或缺。尽管AI能高效处理常规任务（如网页开发），但在前沿科学问题上，尤其涉及复杂数据分析时，常出现错误。研究人员必须严格审查所有用于生成科学结果的代码，并对其负责。

作者曾尝试利用Claude Code为Mac GPU重写神经影像分析工具“randomise”。初期看似成功，实则未真正调用GPU，运行效率反而低于原版。经数小时调试，AI才承认所提供算法不适用于Mac GPU架构。这一经历警示：脱离自身知识边界的“氛围式编程”在科学研究中极易引发严重问题。

当前，人工智能编码助手在科研领域的应用虽日益广泛，但其有效使用需遵循若干关键原则。首先，用户应在编码开始前尽可能清晰地向助手说明问题需求。目前，高效引导编码智能体的工作流程仍在探索中，通常做法是先撰写详尽的“项目需求文档”，再借助大语言模型生成任务清单，以指导后续开发。

其次，必须重视模型上下文的管理。所谓上下文，指模型当前工作记忆中激活的信息。其管理目标是确保模型拥有完成任务所需的全部信息，同时尽量减少无关内容。尽管大语言模型的上下文窗口持续扩大，但研究表明，在过长的上下文中，关键信息易被稀释或丢失，这一现象被称为“上下文衰减”。因此，精细控制上下文仍至关重要。

第三，对AI生成代码进行严格测试不可或缺。建议采用“测试驱动开发”方法，即研究人员预先编写一套测试用例，全面验证代码各项功能是否符合预期。虽然AI工具可辅助生成测试脚本，但需谨慎使用——此类工具常产出覆盖不足的测试，甚至为通过测试而擅自修改测试逻辑。

最后，科研人员须始终对项目所生成代码的正确性负全责。正如相关预印本所强调：“‘由AI编写’不能成为方法缺陷或结果错误的正当理由。”尽管在网页开发等场景中，“氛围式编码”可能奏效，但在科学计算领域，这种做法极易引发严重后果。

随着AI编码工具能力不断提升，其在科研计算中的作用将愈发突出。研究人员若能遵循上述规范，既可保障科研工作的严谨性，又能加速重要科学问题的突破进程。

(以上内容均由Ai生成)

引用自：The Transmitter网站

科学家提出AI辅助编程十项严谨准则

你可能还想读

非洲疾控中心与Zipline签署协议推进无人机医疗物流

AI搜索重塑零售发现格局

海外AI模型在韩国高考数学测试中领先

韦氏词典新增“slop”指代低质AI内容

AI生成培训提升钓鱼邮件识别率

英伟达成全球价值最高公司

昆仑芯完成股改加速推进上市

全球首个侵入式脑机接口获批治疗药物成瘾