Cl

Claude3-Opus

多模态大模型

Claude3-Opus

发布时间: 2024-03-04

模型参数(Parameters)
未披露
最高上下文长度(Context Length)
200K
是否支持中文
支持
推理能力(Reasoning)

模型基本信息

最高上下文输入长度

200K tokens

最长输出结果
未披露
模型类型

多模态大模型

发布时间

2024-03-04

模型预文件大小
暂无数据

开源和体验地址

代码开源状态
预训练权重开源
不开源 - 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验
暂无在线体验地址

API接口信息

接口速度
暂无数据
接口价格
输入价格:
  • 文本: 暂无数据
  • 图片: 暂无数据
  • 音频: 暂无数据
  • 视频: 暂无数据
  • Embedding: 暂无数据
输出价格:
  • 文本: 暂无数据
  • 图片: 暂无数据
  • 音频: 暂无数据
  • 视频: 暂无数据
  • Embedding: 暂无数据

输入支持的模态

文本

输入不支持

图片

输入不支持

视频

输入不支持

音频

输入不支持

Embedding(向量)

输入不支持

输出支持的模态

文本

输出不支持

图片

输出不支持

视频

输出不支持

音频

输出不支持

Embedding(向量)

输出不支持

Claude3-Opus模型在各大评测榜单的评分

评测基准名称
MMLU
(知识问答)
评测结果:86.8
评测基准名称
MMLU Pro
(知识问答)
评测结果:68.45
评测基准名称
GSM8K
(数学推理)
评测结果:95.0
评测基准名称
HumanEval
(代码生成)
评测结果:84.9
评测基准名称
HellaSwag
(常识推理)
评测结果:95.4
评测基准名称
DROP
(阅读理解)
评测结果:83.1
评测基准名称
MATH
(数学推理)
评测结果:60.1
评测基准名称
GPQA Diamond
(常识推理)
评测结果:50.4

发布机构

模型介绍

Claude3-Opus是Anthropic公司发布的第三代多模态大语言模型。第三代的Claude-3模型包含3个版本,这里说的Claude3-Opus是其中能力最强的模型。各项评测人任务结果都非常好,甚至超过了GPT-4。


在多模态方面,Claude3-Opus也有强大的能力。


Claude2最受诟病的就是无效的拒绝回答。由于Anthropic在对齐方面做了严格的工作,导致Claude2.1经常出现拒绝回答的情况。在Claude3-Opus上。Anthropic做了改进,在内部测试中,Claude2.1错误地拒绝比例大概在26%左右,而Claude3-Opus上这个比例下降到了11%,进步明显!

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat