AI

Anthropic发布Claude Sonnet 4.5,强化编码能力

发布时间:2025年9月30日    来源:szf
Anthropic发布Claude Sonnet 4.5,强化编码能力

快速阅读: Anthropic 发布 Claude Sonnet 4.5,引入检查点、代码执行、文件创建等功能,提升代理能力,增强安全性,获业内好评。

Claude Sonnet 4.5 于今日发布,带来了多项编码改进,包括检查点、代码执行、文件创建及终端界面的更新。Anthropic 在周一的新闻稿中宣布了这一消息。

Claude Code 新增了一个备受期待的功能——检查点,允许开发者保存进度或回退到之前的状态。此外,Claude 现在能够执行代码并创建文件,例如电子表格、幻灯片和文档。

在代理方面,Claude API 支持代理运行更长时间,处理更复杂的任务。通过 Claude Agent SDK,开发人员可以创建自己的 AI 代理,这些代理能更好地管理内存、处理权限,并与子代理协作以完成任务。

“我们的 Sonnet 模型支撑着大量的 AI 经济,无论是作为企业产品的一部分还是作为初创公司群背后的基础设施。”Anthropic 的首席人才官 Mike Krieger 在声明中表示,“每隔一段时间,我们就会推出一款我们认为将激发更多创造力的模型。Sonnet 4.5 就是这样一款模型。我们迫不及待地想看看人们会用它创造什么。”

Anthropic 称,Claude Sonnet 4.5 是他们发布的“最对齐前沿的模型”,意味着该模型在“阿谀奉承、欺骗行为、权力追求以及鼓励妄想思维”等方面有了显著改善。Anthropic 还声称,在抵御提示注入攻击方面取得了“重大进展”,这种攻击是指恶意行为者使用精心设计的语言诱骗模型执行其未被设计去做的事情。

iGent AI 的 CEO Sean Ward 在新闻稿中说:“Claude Sonnet 4.5 重置了我们的期望——它可以处理超过 30 小时的自主编码,使我们的工程师能够在大幅减少的时间内解决数月的复杂架构工作,同时在整个大型代码库中保持连贯性。”

随着 AI 竞赛的升温,Claude Sonnet 4.5 的发布恰逢其时。尽管 OpenAI 的 ChatGPT 和谷歌的 Gemini 吸引了大量关注,但像 Anthropic 这样的玩家也在推动 AI 技术的发展。Claude 因其编码能力和对话性质受到粉丝的喜爱。在由 OpenAI 开发的基准测试工具 GDPval 中,Claude Opus 4.1 表现最佳,超过了 GPT-5。这可能是导致 OpenAI 被发现使用 Claude Code 并因违反 Anthropic 的服务条款而失去访问权限的原因。OpenAI 回应称,评估竞争模型的准确性和安全性是行业标准做法,其 API 仍将继续向 Anthropic 提供。今年 8 月,两家公司公布了联合评估对方模型的结果。

(披露:CNET 的母公司 Ziff Davis 于 4 月对 OpenAI 提起诉讼,指控其在训练和运营 AI 系统时侵犯了 Ziff Davis 的版权。)

随着 Anthropic 在某些领域持续领先,该公司正在筹集数十亿美元的资金。最近,Anthropic 完成了 130 亿美元的 F 轮融资,估值达到 1830 亿美元。本月早些时候,Anthropic 还与作者们就非法盗版作品的 15 亿美元诉讼达成了和解。

OSWorld 是一个测试 AI 模型在实际计算机任务中表现的工具,它对 Sonnet 4.5 的评分达到了 61.4%,而四个月前 Sonnet 4 的评分仅为 42.2%。目前,Claude for Chrome 扩展程序已经提供给上个月注册等待名单的用户,该扩展利用了 Sonnet 4.5 的代理功能改进。

(以上内容均由Ai生成)

你可能还想读

网传普京持《薄伽梵歌》照片系AI生成

网传普京持《薄伽梵歌》照片系AI生成

快速阅读: 据媒体报道,近日网传普京在专机手持《薄伽梵歌》的照片系AI合成,经事实核查机构BOOM验证含谷歌SynthID水印,该虚假图像由屡传不实信息的账号首发,旨在制造地缘政治误导。 近日,一张据称显示俄罗斯总统普京在专机上手持《薄伽梵 […]

发布时间:2025年12月8日
AMD锐龙7 9850X3D泄露:单核加速达5.6GHz

AMD锐龙7 9850X3D泄露:单核加速达5.6GHz

快速阅读: 据最新消息,AMD Ryzen 7 9850X3D工程样品在多款主板上运行稳定,单核频率近5.6GHz,Zen 5架构优化显著,平台兼容性良好,有望近期发布。 近日,有关AMD即将推出的Ryzen 7 9850X3D处理器的最新 […]

发布时间:2025年12月8日
英特尔BMG-G31显卡即将发布

英特尔BMG-G31显卡即将发布

快速阅读: 据最新消息,英特尔将BMG-G31显卡纳入软件支持体系,该芯片配备32个Xe2核心与16GB显存,预计2026年初以Arc B770命名亮相,旨在强化中高端GPU市场竞争力。 英特尔公司近日正式将代号为“Big Battlema […]

发布时间:2025年12月8日
戴尔Pro笔记本:AI时代企业首选

戴尔Pro笔记本:AI时代企业首选

快速阅读: 据国际数据公司(IDC)报道,戴尔推出Dell Pro系列AI商用笔记本,搭载NPU与Windows 11 Copilot+,支持长效续航、军工级耐用性及本地AI安全防护,助力企业提升效率并降低长期更新成本。 随着2025年接近 […]

发布时间:2025年12月8日
英伟达4B小模型登顶ARC评测,成本仅GPT-5 Pro的136

英伟达4B小模型登顶ARC评测,成本仅GPT-5 Pro的136

快速阅读: 12月8日消息,英伟达推出4B参数小模型NVARC,在ARC-AGI2评测中以27.64%准确率超越GPT-5Pro,单任务推理成本仅0.2美元,凭借零预训练策略和合成数据实现高效低成本部署。 近日,英伟达研发的4B参数小模型N […]

发布时间:2025年12月8日
Meta收购Limitless加码AI可穿戴设备

Meta收购Limitless加码AI可穿戴设备

快速阅读: 据最新消息,Meta收购AI可穿戴设备公司Limitless,后者以无屏幕智能吊坠著称,具备语音交互与实时转录功能;收购后团队并入Meta,专注AI硬件研发,现有产品将停售但提供一年技术支持。 日前,美国科技企业Meta宣布收购 […]

发布时间:2025年12月8日
沐曦股份科创板申购中签率公布

沐曦股份科创板申购中签率公布

快速阅读: 12月8日消息,沐曦集成电路科创板IPO网上申购户数达517.52万户,启动回拨后最终中签率升至0.03348913%,拟募资39.04亿元用于高性能GPU研发及产业化。 12月8日,国产GPU企业沐曦集成电路(上海)股份有限公 […]

发布时间:2025年12月8日
阿里推Qwen3-TTS:49音色10语9方言,WER碾压商用模型

阿里推Qwen3-TTS:49音色10语9方言,WER碾压商用模型

快速阅读: 12月8日消息,阿里巴巴推出通义千问Qwen3-TTS语音合成模型,支持49种音色、10种语言及9种方言,免费开放每月百万字符额度,并在上海120所中小学试点教育应用。 今日,阿里巴巴正式推出通义千问Qwen3系列新成员——Qw […]

发布时间:2025年12月8日