Name: DeepSeek-V3
Price: 免费商用授权
Rating: 5

DeepSeek AI开源的大语言模型，是其开源的第三代大语言模型。DeepSeek V3是一个混合专家架构的模型（Mixture-of-Experts），总参数量6810亿，每次推理会激活其中370亿的参数。DeepSeek V3模型在14.8万亿tokens上完成训练，花费了278.8万个H800小时训练完成，其各项评测结果都十分优异。

本版本是经过后训练（Post Training）之后的版本。

DeepSeek-V3

模型基本信息

是否支持推理过程

最高上下文输入长度

最长输出结果

模型类型

发布时间

模型预文件大小

开源和体验地址

代码开源状态

预训练权重开源

GitHub 源码

Hugging Face

在线体验

官方介绍与博客

官方论文

DataLearnerAI博客

API接口信息

接口速度（满分5分）

接口价格

输入价格:

输出价格:

输入支持的模态

文本

图片

视频

音频

Embedding（向量）

输出支持的模态

文本

图片

视频

音频

Embedding（向量）

DeepSeek-V3模型在各大评测榜单的评分

发布机构

模型介绍

关注DataLearnerAI公众号