Claude Sonnet 3.7 - Claude Sonnet 3.7

模型详细情况和参数

Claude Sonnet 3.7

模型全称
Claude Sonnet 3.7
模型简称
Claude Sonnet 3.7
模型类型
聊天大模型
发布日期
2025-02-25
预训练文件大小
未知
是否支持中文(中文优化)
最高支持的上下文长度
128K
模型参数数量(亿)
模型代码开源协议
不开源
预训练结果开源商用情况
不开源 - 不开源
模型GitHub链接
暂无
模型HuggingFace链接
暂无
在线演示地址
暂无
基础模型
无基础模型
发布机构
评测结果
评测名称 评测能力方向 评测结果
GPQA Diamond 常识推理 68.0
SWE-bench Verified 代码生成 70.3
MATH-500 数学推理 82.2
AIME 2024 数学推理 23.3

Claude Sonnet 3.7 简介

Claude 3.7 Sonnet是Anthropic发布的第四代大语言模型,相比较Claude Sonnet 3.5模型,Claude Sonnet 3.7能力大幅提升。Claude Sonnet 3.7是经典的大语言模型,它还有一个支持“推理”模式的大语言模型。


2025年2月14日,推特上有用户发现Anthropic在官网和APP上有代码更新,显示Anthropic即将发布新的大模型,就是这个Claude 3.7 Sonnet大模型。2025年2月24日,AWS官网更新了模型的介绍内容。


Claude 3.7 Sonnet 是 Anthropic 至今最智能的模型,也是首个提供扩展思维能力的 Claude 模型——能够通过仔细的逐步推理解决复杂问题。

Anthropic 是第一个推出单一模型的 AI 实验室,用户可以根据需要选择标准思维模式,以实现近乎即时的响应,或选择扩展思维模式进行更高级的推理,从而在速度与质量之间找到平衡。


Claude 3.7 Sonnet 在编程领域具有领先地位,并在计算机使用、智能代理能力、复杂推理和内容生成等方面取得了突破。凭借前沿的性能和对速度的更大控制,Claude 3.7 Sonnet 是驱动 AI 代理的理想选择,尤其适用于面向客户的代理和复杂的 AI 工作流程。


至于为什么叫Claude 3.7 Sonnet,社区认为此前2024年10月份发布的Claude 3.5 Sonnet (New)就是Claude 3.6 Sonnet 。此次应该是为了避免大家混淆,所以取名Claude 3.7 Sonnet。


支持的应用场景:基于大量知识的检索与获取(RAG),产品推荐,预测,精准营销,代码生成,质量控制,从图片中解析文本,智能计算机使用,内容生成。


模型特点:推理,文本生成,代码生成,富文本格式化,智能计算机使用。


以下是更详细的介绍,原文参考: https://www.datalearner.com/blog/1051740051841021 

Claude 3.7 Sonnet与其它模型对比参考: https://www.datalearner.com/ai-models/ai-benchmarks-tests/compare-result?benchmarkInputString=32,36,37,35&modelInputString=513,512,511,501,495,492 


2025年2月25日,Anthropic 公司正式发布了 Claude 3.7 Sonnet 大模型,这一版本在多项能力上实现了显著提升,尤其是代码能力的增强,使其在编程领域更具竞争力。

一、Claude 3.7 Sonnet 大模型简介

Claude 3.7 Sonnet 是业界首个支持双重输出模式的大模型,既支持标准输出模式,也支持深度推理模式。其中,深度推理模式被称为 Claude 3.7 Sonnet with 64K extended thinking,最多支持 128K 长度的输出。这一特性使得模型在处理复杂问题时,能够提供更加详细的推理过程,帮助用户更好地理解模型的思考逻辑。

二、推理过程公开

Anthropic 决定在 Claude 3.7 Sonnet 中公开推理过程,旨在提升用户体验和信任,支持安全性研究。用户可以观察到模型的思维链条,从而更信任输出结果。同时,这为研究人员提供了研究模型行为的机会,有助于探讨扩展思维链条对模型性能的影响。然而,Anthropic 也指出,这一做法可能会带来滥用风险,未来可能会根据研究和反馈进行调整。

三、性能和评测效果

Claude 3.7 Sonnet 在代码和前端网页开发方面表现出色。与 Claude 3.5 Sonnet 相比,其编程水平有了显著提升。在 SWE-Bench 等现实场景的编程评测中,Claude 3.7 Sonnet 不使用推理模式也大幅优于其他模型。虽然在数学推理方面略逊于 OpenAI o1 和 DeepSeek-R1 等模型,但在常识推理和编程方面表现优异。

四、Claude Code 编程 Agent 系统

Anthropic 推出了 Claude Code 编程 Agent 系统,这是一款具备自主行动能力的编程工具,目前处于有限的研究预览阶段。Claude Code 能够搜索和阅读代码、编辑文件、编写和运行测试,还能将代码提交至 GitHub,甚至使用命令行工具。它在测试驱动开发、复杂问题调试和大规模重构方面表现出色,能够显著减少开发时间和工作量。

五、对用户开放及 API 接口

Claude 3.7 Sonnet 模型已在官网开放使用,免费用户和付费用户均可使用,但免费用户无法使用深度思考模式。此外,AWS 和 Google 等云服务也提供了 Claude 3.7 Sonnet 的 API 接口服务。API 接口价格与上一版本相同,输入每 100 万 tokens 3 美元,输出每 100 万 tokens 15 美元。

总之,Claude 3.7 Sonnet 的发布标志着 Anthropic 在大模型领域的又一次重要进步,其双重模式和编程能力的提升,使其在编程领域更具竞争力,为开发者提供了更强大的工具支持。

欢迎大家关注DataLearner官方微信,接受最新的AI模型和技术推送