AI

Anthropic发布Claude Sonnet 4.5,强化编码能力

发布时间:2025年9月30日    来源:szf
Anthropic发布Claude Sonnet 4.5,强化编码能力

快速阅读: Anthropic 发布 Claude Sonnet 4.5,引入检查点、代码执行、文件创建等功能,提升代理能力,增强安全性,获业内好评。

Claude Sonnet 4.5 于今日发布,带来了多项编码改进,包括检查点、代码执行、文件创建及终端界面的更新。Anthropic 在周一的新闻稿中宣布了这一消息。

Claude Code 新增了一个备受期待的功能——检查点,允许开发者保存进度或回退到之前的状态。此外,Claude 现在能够执行代码并创建文件,例如电子表格、幻灯片和文档。

在代理方面,Claude API 支持代理运行更长时间,处理更复杂的任务。通过 Claude Agent SDK,开发人员可以创建自己的 AI 代理,这些代理能更好地管理内存、处理权限,并与子代理协作以完成任务。

“我们的 Sonnet 模型支撑着大量的 AI 经济,无论是作为企业产品的一部分还是作为初创公司群背后的基础设施。”Anthropic 的首席人才官 Mike Krieger 在声明中表示,“每隔一段时间,我们就会推出一款我们认为将激发更多创造力的模型。Sonnet 4.5 就是这样一款模型。我们迫不及待地想看看人们会用它创造什么。”

Anthropic 称,Claude Sonnet 4.5 是他们发布的“最对齐前沿的模型”,意味着该模型在“阿谀奉承、欺骗行为、权力追求以及鼓励妄想思维”等方面有了显著改善。Anthropic 还声称,在抵御提示注入攻击方面取得了“重大进展”,这种攻击是指恶意行为者使用精心设计的语言诱骗模型执行其未被设计去做的事情。

iGent AI 的 CEO Sean Ward 在新闻稿中说:“Claude Sonnet 4.5 重置了我们的期望——它可以处理超过 30 小时的自主编码,使我们的工程师能够在大幅减少的时间内解决数月的复杂架构工作,同时在整个大型代码库中保持连贯性。”

随着 AI 竞赛的升温,Claude Sonnet 4.5 的发布恰逢其时。尽管 OpenAI 的 ChatGPT 和谷歌的 Gemini 吸引了大量关注,但像 Anthropic 这样的玩家也在推动 AI 技术的发展。Claude 因其编码能力和对话性质受到粉丝的喜爱。在由 OpenAI 开发的基准测试工具 GDPval 中,Claude Opus 4.1 表现最佳,超过了 GPT-5。这可能是导致 OpenAI 被发现使用 Claude Code 并因违反 Anthropic 的服务条款而失去访问权限的原因。OpenAI 回应称,评估竞争模型的准确性和安全性是行业标准做法,其 API 仍将继续向 Anthropic 提供。今年 8 月,两家公司公布了联合评估对方模型的结果。

(披露:CNET 的母公司 Ziff Davis 于 4 月对 OpenAI 提起诉讼,指控其在训练和运营 AI 系统时侵犯了 Ziff Davis 的版权。)

随着 Anthropic 在某些领域持续领先,该公司正在筹集数十亿美元的资金。最近,Anthropic 完成了 130 亿美元的 F 轮融资,估值达到 1830 亿美元。本月早些时候,Anthropic 还与作者们就非法盗版作品的 15 亿美元诉讼达成了和解。

OSWorld 是一个测试 AI 模型在实际计算机任务中表现的工具,它对 Sonnet 4.5 的评分达到了 61.4%,而四个月前 Sonnet 4 的评分仅为 42.2%。目前,Claude for Chrome 扩展程序已经提供给上个月注册等待名单的用户,该扩展利用了 Sonnet 4.5 的代理功能改进。

(以上内容均由Ai生成)

你可能还想读

欧洲报告揭示AI新闻助手准确性问题,谷歌Gemini表现最差

欧洲报告揭示AI新闻助手准确性问题,谷歌Gemini表现最差

快速阅读: 欧洲广播联盟和BBC报告显示,AI平台传播新闻存严重风险,影响新闻生态,Perplexity和谷歌AI加剧公众信任下降,研究发现来源、准确性和背景问题是主要障碍。 欧洲广播联盟和BBC发布的一份新报告显示,使用生成式人工智能平台 […]

发布时间:2025年10月23日
AI热潮推动美股大涨,ChatGPT引发21万亿市值增长

AI热潮推动美股大涨,ChatGPT引发21万亿市值增长

快速阅读: 特朗普退让提振市场情绪,但股市上涨主因是AI热潮。自2022年11月ChatGPT推出以来,美国标普500指数市值增加21万亿美元。 特朗普倾向于退让提振了市场情绪,但推动股市上涨的主要动力是围绕生成式人工智能(AI)的炒作。在 […]

发布时间:2025年10月23日
北欧Riff获1600万美元A轮融资,助力企业级AI应用开发

北欧Riff获1600万美元A轮融资,助力企业级AI应用开发

快速阅读: 挪威Riff完成1600万美元A轮融资,累计2100万美元,由Northzone领投。Riff提供AI应用开发平台,支持多行业,旨在提升商业效果和项目成功率,新资金将用于市场扩展。 总部位于奥斯陆的Riff(原名Databutt […]

发布时间:2025年10月23日
Meta裁减AI部门约600岗位,加速技术竞赛

Meta裁减AI部门约600岗位,加速技术竞赛

快速阅读: Meta Platforms 从超级智能实验室裁减约600个职位,以加速AI技术发展。AI首席Alexandr Wang通知裁员,旨在加快决策,增加员工责任。Meta继续为TBD实验室招聘,该团队聚集高薪AI人才。 据报道,Me […]

发布时间:2025年10月23日
渠道伙伴成企业AI转型关键,助力解决安全与数据挑战

渠道伙伴成企业AI转型关键,助力解决安全与数据挑战

快速阅读: Gartner预测,至2026年80%企业将部署生成式AI,但安全与数据基础设施挑战成障碍。研究显示,近半数企业因安全顾虑暂缓云迁移,超半数数据无备份,70%企业过去一年遭遇网络攻击,平均损失五周生产力。VARs在协助企业克服安 […]

发布时间:2025年10月23日
英政府推出AI工具,大幅提高咨询反馈分析效率

英政府推出AI工具,大幅提高咨询反馈分析效率

快速阅读: 英国政府宣布加速人工智能发展,采用“汉弗莱”系列中的Consult工具,每年可节省75,000个人工工作日,该工具处理50,000份咨询回复仅需2小时,效率远超人工。 英国政府宣布,将加速推进人工智能的发展。此前一项研究发现,每 […]

发布时间:2025年10月23日
IBM新Z17主机助力营收大增,AI成增长引擎

IBM新Z17主机助力营收大增,AI成增长引擎

快速阅读: IBM在生成式AI领域赢得95亿美元订单,大型机收入同比增长59%,新Z17机器贡献显著。AI基础设施增长15%,存储成为关键销售点。 克里希纳指出,IBM在生成式AI领域赢得了95亿美元的订单,这是一个显著的成绩。此外,IBM […]

发布时间:2025年10月23日
英特尔之后,消息称美国政府欲用联邦资金入股多家量子计算公司

英特尔之后,消息称美国政府欲用联邦资金入股多家量子计算公司

快速阅读: 特朗普政府正与多家量子计算公司谈判,拟通过联邦资金注资换取股权,涉及IonQ、Rigetti Computing等,每家获至少1000万美元。 感谢IT之家网友 小兴365 的线索投递! IT之家 10 月 23 日消息,据《华 […]

发布时间:2025年10月23日