Cl

Claude Sonnet 3.7-64K Extended Thinking

推理大模型

Claude Sonnet 3.7-64K Extended Thinking

发布时间: 2025-02-25

模型参数(Parameters)
未披露
最高上下文长度(Context Length)
128K
是否支持中文
支持
推理能力(Reasoning)

模型基本信息

最高上下文输入长度

128K tokens

最长输出结果
未披露
模型类型

推理大模型

发布时间

2025-02-25

模型预文件大小
暂无数据

开源和体验地址

代码开源状态
预训练权重开源
不开源 - 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验
暂无在线体验地址

API接口信息

接口速度
暂无数据
接口价格
输入价格:
  • 文本: 暂无数据
  • 图片: 暂无数据
  • 音频: 暂无数据
  • 视频: 暂无数据
  • Embedding: 暂无数据
输出价格:
  • 文本: 暂无数据
  • 图片: 暂无数据
  • 音频: 暂无数据
  • 视频: 暂无数据
  • Embedding: 暂无数据

输入支持的模态

文本

输入不支持

图片

输入不支持

视频

输入不支持

音频

输入不支持

Embedding(向量)

输入不支持

输出支持的模态

文本

输出不支持

图片

输出不支持

视频

输出不支持

音频

输出不支持

Embedding(向量)

输出不支持

Claude Sonnet 3.7-64K Extended Thinking模型在各大评测榜单的评分

评测基准名称
GPQA Diamond
(常识推理)
评测结果:84.8
评测基准名称
MATH-500
(数学推理)
评测结果:96.2
评测基准名称
AIME 2024
(数学推理)
评测结果:80.0

发布机构

模型介绍

Claude Sonnet 3.7-64K Extended Thinking是Anthropic发布的第四代大语言模型,是Claude 3.7 Sonnet开启推理模式之后的大模型。


以下是更详细的介绍,原文参考: https://www.datalearner.com/blog/1051740051841021 

Claude 3.7 Sonnet与其它模型对比参考: https://www.datalearner.com/ai-models/ai-benchmarks-tests/compare-result?benchmarkInputString=32,36,37,35&modelInputString=513,512,511,501,495,492 


2025年2月25日,Anthropic 公司正式发布了 Claude 3.7 Sonnet 大模型,这一版本在多项能力上实现了显著提升,尤其是代码能力的增强,使其在编程领域更具竞争力。

一、Claude 3.7 Sonnet 大模型简介

Claude 3.7 Sonnet 是业界首个支持双重输出模式的大模型,既支持标准输出模式,也支持深度推理模式。其中,深度推理模式被称为 Claude 3.7 Sonnet with 64K extended thinking,最多支持 128K 长度的输出。这一特性使得模型在处理复杂问题时,能够提供更加详细的推理过程,帮助用户更好地理解模型的思考逻辑。

二、推理过程公开

Anthropic 决定在 Claude 3.7 Sonnet 中公开推理过程,旨在提升用户体验和信任,支持安全性研究。用户可以观察到模型的思维链条,从而更信任输出结果。同时,这为研究人员提供了研究模型行为的机会,有助于探讨扩展思维链条对模型性能的影响。然而,Anthropic 也指出,这一做法可能会带来滥用风险,未来可能会根据研究和反馈进行调整。

三、性能和评测效果

Claude 3.7 Sonnet 在代码和前端网页开发方面表现出色。与 Claude 3.5 Sonnet 相比,其编程水平有了显著提升。在 SWE-Bench 等现实场景的编程评测中,Claude 3.7 Sonnet 不使用推理模式也大幅优于其他模型。虽然在数学推理方面略逊于 OpenAI o1 和 DeepSeek-R1 等模型,但在常识推理和编程方面表现优异。

四、Claude Code 编程 Agent 系统

Anthropic 推出了 Claude Code 编程 Agent 系统,这是一款具备自主行动能力的编程工具,目前处于有限的研究预览阶段。Claude Code 能够搜索和阅读代码、编辑文件、编写和运行测试,还能将代码提交至 GitHub,甚至使用命令行工具。它在测试驱动开发、复杂问题调试和大规模重构方面表现出色,能够显著减少开发时间和工作量。

五、对用户开放及 API 接口

Claude 3.7 Sonnet 模型已在官网开放使用,免费用户和付费用户均可使用,但免费用户无法使用深度思考模式。此外,AWS 和 Google 等云服务也提供了 Claude 3.7 Sonnet 的 API 接口服务。API 接口价格与上一版本相同,输入每 100 万 tokens 3 美元,输出每 100 万 tokens 15 美元。

总之,Claude 3.7 Sonnet 的发布标志着 Anthropic 在大模型领域的又一次重要进步,其双重模式和编程能力的提升,使其在编程领域更具竞争力,为开发者提供了更强大的工具支持。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat