Claude Sonnet4.5发布，编码能力领先，Imagine功能探索AI新界面

发布时间：2025年9月30日来源：szf

快速阅读: Anthropic发布Claude Sonnet4.5，技术指标全面提升，尤其在编码能力和安全性上领先。新功能Imagine with Claude可实时生成软件界面，展现AI动态生成应用潜力。

Anthropic深夜发布了Claude Sonnet4.5版本，此次更新不仅在技术指标上实现了全面升级，还通过实验性功能Imagine with Claude展示了AI实时生成软件界面的创新方向。

Claude Sonnet4.5在编码能力方面取得了显著突破，在SWE-bench Verified基准测试中获得了77.2%的分数，超越了前代Claude Opus4.1的74.5%，被Anthropic誉为全球最佳编码模型。它在逻辑推理、高级数学和多步骤编码任务上的表现尤为突出，能够自主运行超过30小时以处理复杂的代理任务。

值得注意的是，尽管Sonnet4.5的模型规模小于Opus4.1，但在多个能力维度上实现了领先。其定价策略保持不变，API输入每百万token收费3美元，输出每百万token收费15美元，用户可以通过Claude API、Amazon Bedrock和Google Vertex AI访问该模型。

在安全性方面，新版本优化了模型的对齐性，减少了讨好用户、欺骗等不良行为模式，并采用了ASL-3安全框架来过滤潜在危险内容。该模型已能够独立重建Claude.ai网页应用，耗时5.5小时完成超过3000次工具调用，展现出接近生产级应用的能力。

此次发布的最大亮点是Imagine with Claude的实验功能，该功能仅向Max订阅用户开放5天体验期。此功能提供了一个类似桌面环境的交互界面，用户可以通过自然语言输入需求，Claude Sonnet4.5将实时生成UI元素、功能逻辑和交互机制。

与传统的软件开发不同，Imagine功能不依赖预设代码或固定模板，而是根据用户意图动态生成完整应用。例如，当用户提出创建天气预报应用的需求时，AI会即时渲染界面、实现功能逻辑和数据交互。用户还可以将生成的应用放置在桌面环境中使用。

伴随模型的发布，Anthropic推出了Claude Agent SDK，允许开发者利用内部基础设施构建自定义代理，支持虚拟机访问、内存管理和多代理协作。Claude Code新增了检查点功能，支持即时回滚进度，并集成了VS Code和JetBrains开发环境，以及面向Max用户的Chrome扩展。

Imagine with Claude功能引发了关于AI原生操作系统的广泛讨论。这种实时生成界面的方式挑战了传统的软件开发模式，不再依赖预先编写的代码，而是让AI根据用户意图动态演化界面和逻辑。

需要指出的是，Imagine功能目前仍处于早期实验阶段，复杂UI的按钮响应存在延迟问题，需要进一步优化。Anthropic表示，此举旨在探索代理能力的边界，未来将扩展到更多应用场景。

从技术发展趋势来看，Claude Sonnet4.5巩固了Anthropic在编码领域的竞争地位，而Imagine功能则代表了一种新的人机交互范式的探索。这种实时生成软件界面的能力，可能会为未来应用开发和用户体验设计带来根本性的变革。然而，也需保持理性认知，当前的实验性功能距离真正的AI原生操作系统还有一定距离，稳定性、性能优化和安全保障等问题仍需在实际应用中逐步解决。

(以上内容均由Ai生成)