CL

Claude Opus 4

Claude Opus 4

发布时间: 2025-05-23965
模型参数
未披露
上下文长度
200K
中文支持
支持
推理能力

模型基本信息

推理过程
支持
上下文长度
200K tokens
最大输出长度
32000 tokens
模型类型
暂无数据
发布时间
2025-05-23
模型文件大小
暂无数据
推理模式
暂无模式数据

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源- 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址

官方介绍与博客

API接口信息

接口速度
3/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
标准计费Standard
模态输入输出
文本$15$75
图片$15--

评测得分

综合评估

共 5 项评测
评测名称 / 模式
得分
排名/总数
MMLU Pronormal
85
11 / 107
79.60
43 / 137
ARC-AGInormal
35.70
22 / 36
HLEnormal
10.70
54 / 76
ARC-AGI-2normal
8.60
11 / 26

编程与软件工程

共 2 项评测
评测名称 / 模式
得分
排名/总数
72.50
19 / 69
56.60
56 / 98

数学推理

共 8 项评测
评测名称 / 模式
得分
排名/总数
MATH-500normal
98.20
3 / 42
AIME 2024normal
76
36 / 62
AIME2025normal
75.50
55 / 96
4.50
30 / 51
4.20
8 / 28
FrontierMaththinking
4.10
32 / 51
2.90
16 / 16
0.01
21 / 28

写作和创作

共 1 项评测
评测名称 / 模式
得分
排名/总数
83.75
13 / 22

常识推理

共 1 项评测
评测名称 / 模式
得分
排名/总数
Simple Benchthinking
58.80
7 / 25

Agent能力评测

共 3 项评测
评测名称 / 模式
得分
排名/总数
τ²-Benchthinking + 使用工具
72.50
10 / 26
72
8 / 22
70.10
11 / 22

发布机构

模型解读

Anthropic 近日推出了 Claude Opus 4,这是其迄今为止最智能的模型,旨在推动编码、代理搜索和创意写作领域的界限。作为 Claude 模型家族中的旗舰产品,Opus 4 代表了人工智能在复杂推理和自主工作方面的显著进步。

核心能力与应用场景

Claude Opus 4 被设计为一种混合推理模型,能够提供即时响应,也能进行分步思考,并通过用户友好的摘要展示其推理过程。对于 API 用户,该模型提供了对思考预算的精细控制,以优化成本和性能。其主要应用场景包括:

      关键特性与性能

      Claude Opus 4 在多项基准测试中取得了业界领先的成果,包括编码方面的 SWE-bench,以及 MMLU、GPQA 和 Aider Polyglot。它还以卓越的写作能力超越了之前的 Claude 模型,为自然、类人散文设定了新标准。该模型拥有一个 200K 的上下文窗口。Anthropic 还特别提到,Opus 4 使得在后台运行 Claude Code 成为可能,允许开发者分配长时间运行的编码任务,由 Opus 独立处理。

      可用性与定价

      Claude Opus 4 面向需要与 Anthropic 最强大模型协作处理复杂任务的商业用户和消费者,可通过 Claude for Pro、Max、Team 和 Enterprise 用户获得。对于有兴趣构建需要前沿智能的 AI 解决方案的开发者,Claude Opus 4 可通过 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 访问。定价方面,Claude Opus 4 的输入 token 价格为每百万美元 15 美元,输出 token 价格为每百万美元 75 美元,通过即时缓存可节省高达 90% 的成本,通过批量处理可节省 50% 的成本。