Claude Sonnet 3.7-64K Extended Thinking - Claude Sonnet 3.7-64K Extended Thinking

模型详细情况和参数

Claude Sonnet 3.7-64K Extended Thinking

模型全称
Claude Sonnet 3.7-64K Extended Thinking
模型简称
Claude Sonnet 3.7-64K Extended Thinking
模型类型
推理大模型
发布日期
2025-02-25
预训练文件大小
未知
是否支持中文(中文优化)
最高支持的上下文长度
128K
模型参数数量(亿)
模型代码开源协议
不开源
预训练结果开源商用情况
不开源 - 不开源
模型GitHub链接
暂无
模型HuggingFace链接
暂无
在线演示地址
暂无
基础模型
无基础模型
发布机构
评测结果
评测名称 评测能力方向 评测结果
GPQA Diamond 常识推理 84.8
MATH-500 数学推理 96.2
AIME 2024 数学推理 80.0

Claude Sonnet 3.7-64K Extended Thinking 简介

Claude Sonnet 3.7-64K Extended Thinking是Anthropic发布的第四代大语言模型,是Claude 3.7 Sonnet开启推理模式之后的大模型。


以下是更详细的介绍,原文参考: https://www.datalearner.com/blog/1051740051841021 

Claude 3.7 Sonnet与其它模型对比参考: https://www.datalearner.com/ai-models/ai-benchmarks-tests/compare-result?benchmarkInputString=32,36,37,35&modelInputString=513,512,511,501,495,492 


2025年2月25日,Anthropic 公司正式发布了 Claude 3.7 Sonnet 大模型,这一版本在多项能力上实现了显著提升,尤其是代码能力的增强,使其在编程领域更具竞争力。

一、Claude 3.7 Sonnet 大模型简介

Claude 3.7 Sonnet 是业界首个支持双重输出模式的大模型,既支持标准输出模式,也支持深度推理模式。其中,深度推理模式被称为 Claude 3.7 Sonnet with 64K extended thinking,最多支持 128K 长度的输出。这一特性使得模型在处理复杂问题时,能够提供更加详细的推理过程,帮助用户更好地理解模型的思考逻辑。

二、推理过程公开

Anthropic 决定在 Claude 3.7 Sonnet 中公开推理过程,旨在提升用户体验和信任,支持安全性研究。用户可以观察到模型的思维链条,从而更信任输出结果。同时,这为研究人员提供了研究模型行为的机会,有助于探讨扩展思维链条对模型性能的影响。然而,Anthropic 也指出,这一做法可能会带来滥用风险,未来可能会根据研究和反馈进行调整。

三、性能和评测效果

Claude 3.7 Sonnet 在代码和前端网页开发方面表现出色。与 Claude 3.5 Sonnet 相比,其编程水平有了显著提升。在 SWE-Bench 等现实场景的编程评测中,Claude 3.7 Sonnet 不使用推理模式也大幅优于其他模型。虽然在数学推理方面略逊于 OpenAI o1 和 DeepSeek-R1 等模型,但在常识推理和编程方面表现优异。

四、Claude Code 编程 Agent 系统

Anthropic 推出了 Claude Code 编程 Agent 系统,这是一款具备自主行动能力的编程工具,目前处于有限的研究预览阶段。Claude Code 能够搜索和阅读代码、编辑文件、编写和运行测试,还能将代码提交至 GitHub,甚至使用命令行工具。它在测试驱动开发、复杂问题调试和大规模重构方面表现出色,能够显著减少开发时间和工作量。

五、对用户开放及 API 接口

Claude 3.7 Sonnet 模型已在官网开放使用,免费用户和付费用户均可使用,但免费用户无法使用深度思考模式。此外,AWS 和 Google 等云服务也提供了 Claude 3.7 Sonnet 的 API 接口服务。API 接口价格与上一版本相同,输入每 100 万 tokens 3 美元,输出每 100 万 tokens 15 美元。

总之,Claude 3.7 Sonnet 的发布标志着 Anthropic 在大模型领域的又一次重要进步,其双重模式和编程能力的提升,使其在编程领域更具竞争力,为开发者提供了更强大的工具支持。

欢迎大家关注DataLearner官方微信,接受最新的AI模型和技术推送