软件工程原生 AI 模型已经问世:Windsurf 的 Swe-1 对技术决策者的意义
快速阅读: 据《VentureBeat 公司》称,风帆推出SWE-1系列AI模型,专注加速软件工程全流程。该系列包括全尺寸、轻量版和微型版,旨在提升编码之外的开发效率。尽管风帆被OpenAI收购交易未定,但SWE-1已面向用户开放,强调流式感知和共享时间线技术。
加入我们的每日和每周通讯,获取行业领先的人工智能覆盖的最新动态和独家内容。了解更多
截至目前,风帆编码平台(原名Codeium)主要依赖现有的大型语言模型(LLMs)来协助编写代码。然而,编写代码只是开发人员构建完整企业级生产平台所需执行的众多任务之一。完整的软件工程工作流程中的其他任务需要使用不同的工具来帮助审查、提交并随着时间的推移维护代码。这是一个挑战。风帆公司通过其称为“软件工程师1号”(SWE-1)的一系列新前沿人工智能模型应对这一挑战,这是该公司Wave 9更新的一部分。
有报道称,风帆正处于被人工智能领域领导者OpenAI收购的过程中,交易金额最高可达30亿美元。这笔交易尚未正式完成,风帆目前不对这笔交易发表公开评论。
SWE-1是一系列专门设计用于加速整个软件工程过程的前沿级人工智能模型。与经过调整以适应编码任务的通用人工智能模型不同,SWE-1系列旨在解决软件工程活动的全谱问题。这些新模型旨在通过多个界面支持开发者,包括不完整的工作状态和长时间运行的任务,这些都是现实世界软件开发的特点。
SWE-1现已立即向风帆用户开放,标志着该公司在前沿模型开发方面的迈进,其性能大幅优于已建立的基础模型,但专注于软件工程工作流程。
风帆的产品和战略主管阿努舒尔·拉马钱德兰告诉VentureBeat:“我们在这里的主要目标是将所有软件工程加速99%。”
企业开发人员需要的不仅仅是具备编码能力的模型
SWE-1背后的核心创新是风帆认识到编码仅占软件工程师实际所做工作的很小一部分。这种方法解决了当前人工智能编码LLMs的一个关键限制。今天可以使用许多不同的模型来编写应用程序代码,包括OpenAI的GPT-4.1、Anthropic的Claude 3.7和Google的Gemini 2.5 Pro I/O版本。风帆有一个模块化接口,可以启用多种不同模型的使用。
拉马钱德兰解释说,风帆用户给公司反馈说现有的编码模型在用户指导下通常表现良好,但随着时间的推移往往会错过一些东西。这种限制源于任务结构的根本差异。虽然代码生成通常是单一任务,但真实的软件工程涉及导航多个工具,处理不完整的代码,并在长时间运行的项目中保持上下文。
SWE-1系列:专门针对不同工程任务设计
风帆并没有创建一个一刀切的解决方案,而是开发了三个专门的模型:
– SWE-1:专为高级推理和工具使用设计的全尺寸模型,可供所有付费用户使用。
– SWE-1轻量版:一个较小但功能强大的模型,取代了风帆现有的Cascade Base,可供所有用户(免费和付费)使用。
– SWE-1微型版:一种轻量级模型,在风帆标签中提供被动代码预测,供所有用户无限使用。
SWE-1轻量版:一个较小但功能强大的模型,取代了风帆现有的Cascade Base,可供所有用户(免费和付费)使用。
SWE模型是通过专门针对软件工程任务的广泛内部培训过程构建的。拉马钱德兰表示,该公司使用了一种新的数据模型进行训练,其中包含顺序步骤。
性能基准:SWE-1如何比较
尽管SWE-1并不打算取代主要实验室的基础模型,但风帆声称它在软件工程任务上实现了前沿级性能。该公司报告称,它大幅优于中型基础模型和开源权重模型。然而,风帆小心翼翼地不过度宣传这些初步结果。
“即使我们的基准测试显示它并不在客观上优于所有其他模型,”拉马钱德兰承认。相反,目标是将SWE-1定位为向专门模型迈出的第一步,这些专门模型最终将在特定工程任务上超越通用模型——并且可能成本更低。
技术优势:流式感知和共享时间线
风帆的方法在技术上的独特之处在于其实现了流式感知的概念。基本想法是在企业开发过程中需要发生一系列步骤。与其只为某个特定步骤编写代码,不如关注更广泛的背景。流式感知集中在人类和AI在软件开发中的共同行动时间线上。
核心思想是通过理解AI可以在哪里最有效地协助,逐步将任务从人类移交到AI。这种方法为模型创造了持续优化的循环。
“随着我们不断改进模型,共享时间线中的更多步骤将从人类转向AI,”拉马钱德兰说。“AI将能够完成人类之前必须做的事情,因为AI之前不够准确。”
这对技术负责人意味着什么
对于正在构建或维护软件的企业来说,SWE-1代表了AI辅助开发的重要演变。与其将AI编码助手视为简单的自动补全工具,这种方法承诺加速整个开发生命周期。潜在影响不仅限于更快地编写代码。认识到应用程序开发更加复杂将有助于成熟振动编码范式,使其更适合稳定的企业软件开发。
虽然SWE-1仍处于早期阶段,但这一举措很重要。如果OpenAI完成对风帆的收购,当新的模型与更大的模型研究和开发资源相交时,它们可能会变得更加重要。
技术负责人应考虑他们的发展工作流程中有多少部分可以从AI辅助中受益,而不仅仅是代码生成。在代码评审、调试和管理技术债上花费大量时间的团队可能会从像SWE-1这样的工具中看到比那些主要专注于生成新代码的团队更实质性的收益。
VB每日商业用例洞察
如果你想给老板留下深刻印象,VB每日可以帮你。我们为你提供公司如何使用生成式AI的内幕信息,从监管变化到实际部署,以便你可以分享见解以实现最大ROI。现在订阅阅读我们的隐私条款感谢订阅。
查看更多VB新闻通讯。
出现错误。
(以上内容均由Ai生成)