DeepSeek-V3（DeepSeek-V3）详细信息 | 名称、简介、使用方法，开源情况，商用授权信息

DeepSeek-V3 - DeepSeek-V3

模型详细情况和参数

DeepSeek-V3

模型全称: DeepSeek-V3
模型简称: DeepSeek-V3
模型类型: 聊天大模型
发布日期: 2024-12-26
预训练文件大小: 687.9 GB
是否支持中文（中文优化）: 是
最高支持的上下文长度: 128K
模型参数数量（亿）: 6810.0
模型代码开源协议: MIT License
预训练结果开源商用情况: DEEPSEEK LICENSE AGREEMENT - 免费商用授权
模型GitHub链接: https://github.com/deepseek-ai/DeepSeek-V3
模型HuggingFace链接: https://huggingface.co/deepseek-ai/DeepSeek-V3
在线演示地址: 暂无
DataLearnerAI的模型介绍
官方博客论文: Introducing DeepSeek-V3
基础模型: 无基础模型
发布机构: DeepSeek-AI

评测名称	评测能力方向	评测结果
MMLU	知识问答	88.5
MMLU Pro	知识问答	75.9
GPQA Diamond	常识推理	59.1
SimpleQA	真实性评估	24.9
AIME 2024	数学推理	39.0

DeepSeek-V3 简介

DeepSeek AI开源的大语言模型，是其开源的第三代大语言模型。DeepSeek V3是一个混合专家架构的模型（Mixture-of-Experts），总参数量6810亿，每次推理会激活其中370亿的参数。DeepSeek V3模型在14.8万亿tokens上完成训练，花费了278.8万个H800小时训练完成，其各项评测结果都十分优异。

本版本是经过后训练（Post Training）之后的版本。

欢迎大家关注DataLearner官方微信，接受最新的AI模型和技术推送

DeepSeek-V3所属的领域

自然语言处理

Natural Language Process

35个资源

DeepSeek-V3 - DeepSeek-V3

DeepSeek-V3

DeepSeek-V3 简介

欢迎大家关注DataLearner官方微信，接受最新的AI模型和技术推送

DeepSeek-V3所属的领域

DeepSeek-V3相关的任务