De

DeepSeek-R1

推理大模型

DeepSeek-R1

发布时间: 2025-01-20

GitHub Hugging Face 在线体验

模型参数（Parameters）

6710.0

最高上下文长度（Context Length）

128K

是否支持中文

支持

推理能力（Reasoning）

模型基本信息

是否支持推理过程

支持

最高上下文输入长度

128K tokens

最长输出结果

暂无数据

模型类型

推理大模型

发布时间

2025-01-20

模型预文件大小

134GB

开源和体验地址

代码开源状态

预训练权重开源

MIT License - 免费商用授权

GitHub 源码

暂无GitHub开源地址

Hugging Face

https://huggingface.co/deepseek-ai/DeepSeek-R1

在线体验

暂无在线体验地址

官方介绍与博客

官方论文

DeepSeek_R1.pdf

DataLearnerAI博客

什么是推理大模型？DeepSeek R1推理大模型与DeepSeek V3模型的区别是什么？什么时候该使用推理大模型？

API接口信息

接口速度（满分5分）

暂无数据

接口价格

输入价格:

文本: 暂无数据
图片: 暂无数据
音频: 暂无数据
视频: 暂无数据
Embedding: 暂无数据

输出价格:

文本: 暂无数据
图片: 暂无数据
音频: 暂无数据
视频: 暂无数据
Embedding: 暂无数据

输入支持的模态

文本

输入不支持

图片

输入不支持

视频

输入不支持

音频

输入不支持

Embedding（向量）

输入不支持

输出支持的模态

文本

输出不支持

图片

输出不支持

视频

输出不支持

音频

输出不支持

Embedding（向量）

输出不支持

DeepSeek-R1模型在各大评测榜单的评分

评测基准名称

评测类型

评测结果

评测基准名称

MMLU

(知识问答)

评测结果：90.8

知识问答

90.8

评测基准名称

MMLU Pro

(知识问答)

评测结果：84.0

知识问答

84.0

评测基准名称

GPQA Diamond

(常识推理)

评测结果：71.5

常识推理

71.5

评测基准名称

SimpleQA

(真实性评估)

评测结果：30.1

真实性评估

30.1

评测基准名称

SWE-bench Verified

(代码生成)

评测结果：49.2

SWE-bench Verified

代码生成

49.2

评测基准名称

MATH-500

(数学推理)

评测结果：97.3

数学推理

97.3

评测基准名称

AIME 2024

(数学推理)

评测结果：79.8

数学推理

79.8

评测基准名称

LiveCodeBench

(代码生成)

评测结果：65.9

代码生成

65.9

评测基准名称

AIME2025

(数学推理)

评测结果：70.0

数学推理

70.0

发布机构

DeepSeek-AI

查看发布机构详情

模型介绍

DeepSeekAI发布的推理大模型，是接近OpenAI o1推理大模型的开源版本，完全免费开源，性能强悍，是基于DeepSeek R1 Zero基础上微调后得到的。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号，接受最新大模型资讯

DataLearnerAI WeChat