Claude Opus 4

Name: Claude Opus 4
Availability: InStock
Author: Anthropic

发布时间: 2025-05-23965

在线体验 GitHub Hugging Face

模型参数

未披露

上下文长度

200K

中文支持

支持

推理能力

模型基本信息

推理过程

支持

上下文长度

200K tokens

最大输出长度

32000 tokens

模型类型

暂无数据

发布时间

2025-05-23

模型文件大小

暂无数据

推理模式

暂无模式数据

开源和体验地址

代码开源状态

不开源

预训练权重开源

不开源- 不开源

GitHub 源码

暂无GitHub开源地址

Hugging Face

暂无开源HuggingFace地址

在线体验

https://claude.ai/new

官方介绍与博客

官方论文

Introducing Claude 4

DataLearnerAI博客

Anthropic发布Claude4，全球最强编程大模型，大幅提升AI Agent系统所需的各项能力，最长可以7小时连续工作，80%工程任务自主完成

API接口信息

接口速度

3/5

💡默认单位：$/100万 tokens。若计费单位不同，则以供应商公开的原始标注为准。

标准计费Standard

模态	输入	输出
文本	$15	$75
图片	$15	--

评测得分

综合评估

共 5 项评测

评测名称 / 模式

得分

排名/总数

MMLU Pronormal

11 / 107

GPQA Diamondnormal

79.60

43 / 137

ARC-AGInormal

35.70

22 / 36

HLEnormal

10.70

54 / 76

ARC-AGI-2normal

8.60

11 / 26

编程与软件工程

共 2 项评测

评测名称 / 模式

得分

排名/总数

SWE-bench Verifiednormal

72.50

19 / 69

LiveCodeBenchnormal

56.60

56 / 98

数学推理

共 8 项评测

评测名称 / 模式

得分

排名/总数

MATH-500normal

98.20

3 / 42

AIME 2024normal

36 / 62

AIME2025normal

75.50

55 / 96

FrontierMathnormal

4.50

30 / 51

FrontierMath - Tier 4thinking

4.20

8 / 28

FrontierMaththinking

4.10

32 / 51

IMO-ProofBenchthinking

2.90

16 / 16

FrontierMath - Tier 4normal

0.01

21 / 28

写作和创作

共 1 项评测

评测名称 / 模式

得分

排名/总数

Creative Writingnormal

83.75

13 / 22

常识推理

共 1 项评测

评测名称 / 模式

得分

排名/总数

Simple Benchthinking

58.80

7 / 25

Agent能力评测

共 3 项评测

评测名称 / 模式

得分

排名/总数

τ²-Benchthinking + 使用工具

72.50

10 / 26

Aider-Polyglotthinking

8 / 22

Aider-Polyglotnormal

70.10

11 / 22

发布机构

Anthropic

查看发布机构详情

模型解读

Anthropic 近日推出了 Claude Opus 4，这是其迄今为止最智能的模型，旨在推动编码、代理搜索和创意写作领域的界限。作为 Claude 模型家族中的旗舰产品，Opus 4 代表了人工智能在复杂推理和自主工作方面的显著进步。

核心能力与应用场景

Claude Opus 4 被设计为一种混合推理模型，能够提供即时响应，也能进行分步思考，并通过用户友好的摘要展示其推理过程。对于 API 用户，该模型提供了对思考预算的精细控制，以优化成本和性能。其主要应用场景包括：

关键特性与性能

Claude Opus 4 在多项基准测试中取得了业界领先的成果，包括编码方面的 SWE-bench，以及 MMLU、GPQA 和 Aider Polyglot。它还以卓越的写作能力超越了之前的 Claude 模型，为自然、类人散文设定了新标准。该模型拥有一个 200K 的上下文窗口。Anthropic 还特别提到，Opus 4 使得在后台运行 Claude Code 成为可能，允许开发者分配长时间运行的编码任务，由 Opus 独立处理。

可用性与定价

Claude Opus 4 面向需要与 Anthropic 最强大模型协作处理复杂任务的商业用户和消费者，可通过 Claude for Pro、Max、Team 和 Enterprise 用户获得。对于有兴趣构建需要前沿智能的 AI 解决方案的开发者，Claude Opus 4 可通过 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 访问。定价方面，Claude Opus 4 的输入 token 价格为每百万美元 15 美元，输出 token 价格为每百万美元 75 美元，通过即时缓存可节省高达 90% 的成本，通过批量处理可节省 50% 的成本。