麻省理工学院的研究人员希望通过新的控件来驯服 AI 代码

快速阅读: 据《安保大道》最新报道，麻省理工学院研究团队通过顺序蒙特卡洛算法提升了AI编码工具的准确性，使其生成更符合编程规则的代码。这一进展不仅有助于提高软件开发效率，还降低了非专业人士使用AI工具的门槛，同时增强了AI在数据分析和科学发现中的应用潜力。

尽管人工智能（AI）编码存在诸多风险，开发人员依然热情高涨，利用它快速交付软件。近期GitHub的一项调查显示，只有不到一半的开发者（43%）对AI工具的准确性感到满意，而31%的人则对其持怀疑态度。来自麻省理工学院及其他机构的研究人员正试图通过一种适用于多种语言的新控制方法来驯服基于大语言模型的AI编码工具。根据《MIT News》的文章《让任何语言生成的代码更加准确》：随着AI编码带来的风险增加，这一进步无疑将受到应用安全（AppSec）团队的欢迎。以下是您需要了解的内容。[获取白皮书：AI崛起如何影响软件供应链安全]

随着AI编码带来的风险增加，这一进步无疑将受到应用安全（AppSec）团队的欢迎。以下是您需要了解的内容。

**驾驭LLMs**

云安全联盟首席创新官库尔特·赛弗里德表示，麻省理工学院的研究解决了AI编码助手的一个重大问题，即“使其可靠到足以用于实际应用”。赛弗里德指出，AI模型可以快速编写代码，但它们难以遵循精确的编程规则或语法。目前的方法要么浪费资源，要求完全重写错误代码，要么进行修复，从而改变了代码原本应该实现的功能。

Sectigo产品高级副总裁杰森·索罗科表示，麻省理工学院的研究人员已经证明，通过引导大型语言模型（LLMs），可以生成语法正确且语义准确的代码，而无需多次尝试。索罗科说，过去的修复方法依赖于事后检查或逐字校正。“这些修复方法常常破坏预期意义或消耗额外计算能力，”他说。

**引入顺序蒙特卡洛算法用于引导AI代码的方向舵**

是顺序蒙特卡洛方法。它允许模型根据不同并行计算线程输出的前景性动态分配资源。“模型保留多个候选序列，为每个序列赋予反映其匹配声明结构和目标程度的权重，然后重新采样，使计算跟随最高权重并丢弃其余部分，”索罗科解释道。

**鬼安全公司创始人兼首席执行官格雷格·马丁表示，将顺序蒙特卡洛方法集成到较小的LLMs中以生成更高质量的AI代码，可能对本地开源AI模型是一个重大胜利。**

SlashNext的现场CTO斯蒂芬·科斯基表示，麻省理工学院的研究表明，即使较小的AI模型，在更智能的算法下也能编写出准确且符合编程规则的代码，有时甚至比更大的模型还要好。

麻省理工学院脑与认知科学系概率计算项目的主要研究科学家维卡什·库马尔·曼辛哈卡概述了顺序蒙特卡洛方法的工作原理示例。曼辛哈卡表示，新方法将工程重新置于驾驶座上——并且效率很高。“它以一种非常不寻常的方式实现这一点，不是通过调整模型或进行强化学习或收集大量数据，而是通过在LLM上包裹一层概率推理的符号表示知识，”他说。

**为什么驯服LLMs是AI实用性的核心**

奥莱利媒体的作者兼讲师梅洛迪（MJ）考夫曼表示，尽管麻省理工学院的研究显然有潜力改善AI编码助手，但它也可能对AI驱动的数据分析和科学发现工具有用。考夫曼指出，对于科学发现工具而言，这项研究增强了多步推理能力，使AI工具能够更高效地探索复杂的解决方案空间，并生成有用的、新颖的结果，这对研究中使用的大型数据集尤其有价值。

云安全联盟的赛弗里德表示，这项研究的基本性质也意味着AI编码助手将更容易处理更复杂的编程任务。SlashNext的科斯基表示，这项研究可能会使AI编码在建议实际可行且符合需求的代码方面表现得更好，这将大大节省调试时间。“对于数据分析来说，这意味着即使对非编码专家来说，脚本或查询也会更加准确和可靠，”他说。

**麻省理工学院研究对AI代理和编码的意义**

Ghost Security的马丁表示，结合自主型AI，麻省理工学院研究人员的方法可能导致代码生成能力在未来软件中被原生嵌入，从而使软件能够随着时间推移自行提升。“这种动态自我改进是自主模型带给AI最令人兴奋的事情之一，”他说。

但这并不意味着人类可以脱离循环，Gomboc.AI创始人伊夫塔赫·伊恩·阿米特表示。即使由这项研究驱动的LLMs仍然会犯错，“因此开发人员仍需精通所开发的应用程序或语言，以便找到模型生成的代码并非100%正确的领域，”他说。

**降低AI编码门槛**

奥莱利媒体的考夫曼表示，麻省理工学院的研究可能导致非专家对AI生成内容拥有更大控制权。“通过提前筛选掉低质量输出，模型提供了更干净、更准确的结果，需要的技术判断更少一些，”她说。“这样做降低了使用先进AI工具的门槛，使更多人在缺乏深厚专业知识或持续监督的情况下也能生产可靠内容。”

科斯基表示，有了这些改进，任何人都可以用普通语言告诉AI他们想要什么，并得到能工作的代码或数据查询，而不需要知道所有技术细节。

赛弗里德表示，麻省理工学院研究人员开发的方法可以让非程序员仅凭自然语言就能生成复杂的技术输出，如数据库查询。鉴于氛围编码的流行，这一点尤为重要。

**转载博客**

这是安全博客网络的转载博客，由约翰·P·梅洛二世撰写。
[来源链接](https://www.reversinglabs.com/blog/mit-researchers-tame-ai-coding)

(以上内容均由Ai生成)