软件工程原生 AI 模型已经问世:Windsurf 的 Swe-1 对技术决策者的意义

发布时间:2025年5月16日    来源:szf
软件工程原生 AI 模型已经问世:Windsurf 的 Swe-1 对技术决策者的意义

快速阅读: 据《VentureBeat 公司》称,风帆推出SWE-1系列AI模型,专注加速软件工程全流程。该系列包括全尺寸、轻量版和微型版,旨在提升编码之外的开发效率。尽管风帆被OpenAI收购交易未定,但SWE-1已面向用户开放,强调流式感知和共享时间线技术。

加入我们的每日和每周通讯,获取行业领先的人工智能覆盖的最新动态和独家内容。了解更多

截至目前,风帆编码平台(原名Codeium)主要依赖现有的大型语言模型(LLMs)来协助编写代码。然而,编写代码只是开发人员构建完整企业级生产平台所需执行的众多任务之一。完整的软件工程工作流程中的其他任务需要使用不同的工具来帮助审查、提交并随着时间的推移维护代码。这是一个挑战。风帆公司通过其称为“软件工程师1号”(SWE-1)的一系列新前沿人工智能模型应对这一挑战,这是该公司Wave 9更新的一部分。

有报道称,风帆正处于被人工智能领域领导者OpenAI收购的过程中,交易金额最高可达30亿美元。这笔交易尚未正式完成,风帆目前不对这笔交易发表公开评论。

SWE-1是一系列专门设计用于加速整个软件工程过程的前沿级人工智能模型。与经过调整以适应编码任务的通用人工智能模型不同,SWE-1系列旨在解决软件工程活动的全谱问题。这些新模型旨在通过多个界面支持开发者,包括不完整的工作状态和长时间运行的任务,这些都是现实世界软件开发的特点。

SWE-1现已立即向风帆用户开放,标志着该公司在前沿模型开发方面的迈进,其性能大幅优于已建立的基础模型,但专注于软件工程工作流程。

风帆的产品和战略主管阿努舒尔·拉马钱德兰告诉VentureBeat:“我们在这里的主要目标是将所有软件工程加速99%。”

企业开发人员需要的不仅仅是具备编码能力的模型

SWE-1背后的核心创新是风帆认识到编码仅占软件工程师实际所做工作的很小一部分。这种方法解决了当前人工智能编码LLMs的一个关键限制。今天可以使用许多不同的模型来编写应用程序代码,包括OpenAI的GPT-4.1、Anthropic的Claude 3.7和Google的Gemini 2.5 Pro I/O版本。风帆有一个模块化接口,可以启用多种不同模型的使用。

拉马钱德兰解释说,风帆用户给公司反馈说现有的编码模型在用户指导下通常表现良好,但随着时间的推移往往会错过一些东西。这种限制源于任务结构的根本差异。虽然代码生成通常是单一任务,但真实的软件工程涉及导航多个工具,处理不完整的代码,并在长时间运行的项目中保持上下文。

SWE-1系列:专门针对不同工程任务设计

风帆并没有创建一个一刀切的解决方案,而是开发了三个专门的模型:

– SWE-1:专为高级推理和工具使用设计的全尺寸模型,可供所有付费用户使用。
– SWE-1轻量版:一个较小但功能强大的模型,取代了风帆现有的Cascade Base,可供所有用户(免费和付费)使用。
– SWE-1微型版:一种轻量级模型,在风帆标签中提供被动代码预测,供所有用户无限使用。

SWE-1轻量版:一个较小但功能强大的模型,取代了风帆现有的Cascade Base,可供所有用户(免费和付费)使用。

SWE模型是通过专门针对软件工程任务的广泛内部培训过程构建的。拉马钱德兰表示,该公司使用了一种新的数据模型进行训练,其中包含顺序步骤。

性能基准:SWE-1如何比较

尽管SWE-1并不打算取代主要实验室的基础模型,但风帆声称它在软件工程任务上实现了前沿级性能。该公司报告称,它大幅优于中型基础模型和开源权重模型。然而,风帆小心翼翼地不过度宣传这些初步结果。

“即使我们的基准测试显示它并不在客观上优于所有其他模型,”拉马钱德兰承认。相反,目标是将SWE-1定位为向专门模型迈出的第一步,这些专门模型最终将在特定工程任务上超越通用模型——并且可能成本更低。

技术优势:流式感知和共享时间线

风帆的方法在技术上的独特之处在于其实现了流式感知的概念。基本想法是在企业开发过程中需要发生一系列步骤。与其只为某个特定步骤编写代码,不如关注更广泛的背景。流式感知集中在人类和AI在软件开发中的共同行动时间线上。

核心思想是通过理解AI可以在哪里最有效地协助,逐步将任务从人类移交到AI。这种方法为模型创造了持续优化的循环。

“随着我们不断改进模型,共享时间线中的更多步骤将从人类转向AI,”拉马钱德兰说。“AI将能够完成人类之前必须做的事情,因为AI之前不够准确。”

这对技术负责人意味着什么

对于正在构建或维护软件的企业来说,SWE-1代表了AI辅助开发的重要演变。与其将AI编码助手视为简单的自动补全工具,这种方法承诺加速整个开发生命周期。潜在影响不仅限于更快地编写代码。认识到应用程序开发更加复杂将有助于成熟振动编码范式,使其更适合稳定的企业软件开发。

虽然SWE-1仍处于早期阶段,但这一举措很重要。如果OpenAI完成对风帆的收购,当新的模型与更大的模型研究和开发资源相交时,它们可能会变得更加重要。

技术负责人应考虑他们的发展工作流程中有多少部分可以从AI辅助中受益,而不仅仅是代码生成。在代码评审、调试和管理技术债上花费大量时间的团队可能会从像SWE-1这样的工具中看到比那些主要专注于生成新代码的团队更实质性的收益。

VB每日商业用例洞察

如果你想给老板留下深刻印象,VB每日可以帮你。我们为你提供公司如何使用生成式AI的内幕信息,从监管变化到实际部署,以便你可以分享见解以实现最大ROI。现在订阅阅读我们的隐私条款感谢订阅。

查看更多VB新闻通讯。

出现错误。

(以上内容均由Ai生成)

你可能还想读

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

快速阅读: 谷歌推出Pixel 10手机及Pixel Watch 4,新增卫星紧急通讯、可更换电池和屏幕、抬手通话等功能,屏幕亮度达3000尼特,还将与斯蒂芬·库里合作推出AI健康和健身教练服务。 谷歌本周在“由谷歌制造”活动中推出了Pix […]

发布时间:2025年8月23日
SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日