DeepSeek-R1-Lite-Preview - DeepSeek-R1-Lite-Preview

模型详细情况和参数

DeepSeek-R1-Lite-Preview

模型全称
DeepSeek-R1-Lite-Preview
模型简称
DeepSeek-R1-Lite-Preview
模型类型
基础大模型
发布日期
2024-11-20
预训练文件大小
0GB
是否支持中文(中文优化)
最高支持的上下文长度
128K
模型参数数量(亿)
模型代码开源协议
DEEPSEEK LICENSE AGREEMENT
预训练结果开源商用情况
DEEPSEEK LICENSE AGREEMENT - 免费商用授权
模型GitHub链接
暂无
模型HuggingFace链接
暂无
在线演示地址
https://chat.deepseek.com/
DataLearnerAI的模型介绍
基础模型
无基础模型
发布机构

DeepSeek-R1-Lite-Preview 简介

DeepSeek-R1-Lite-Preview是DeepSeek发布的一个推理大模型,对标的是OpenAI的o1模型(参考: https://www.datalearner.com/blog/1051726184271628 )。官方宣称其在高难度推理问题上表现相比较o1模型非常具有竞争力,此外,该模型的思考过程还是公开的。


性能表现

在技术领域表现出色,尤其是高级数学(MATH-500 得分 91.6)和编程竞赛(Codeforces 得分 1450),超越了 OpenAI o1-preview 和 Claude 3.5 Sonnet 等竞争对手。然而,在一般知识和逻辑推理上相对较弱,例如 GPQA Diamond 和 Zebra Logic 得分低于 OpenAI 的同类模型​。


功能亮点

透明推理能力是其主要特点。与 ChatGPT 不同,该模型可以展示逐步推理的详细过程,提高了回答的可解释性和可信度​。相比OpenAI的o1模型,在特定技术任务中具有明显优势,但在处理速度方面稍逊。例如,虽然解决问题的时间比 ChatGPT 更长,但其逐步推理更适合复杂问题​。


当前,该模型还未开源,但是官方宣布未来会开源,目前可以在官网使用:DeepSeek官方提供DeepSeek-R1-Lite-Preview模型每日 50 条消息的限制,并通过 "Deep Think" 功能支持逻辑顺序性较强的问题解决。

欢迎大家关注DataLearner官方微信,接受最新的AI模型和技术推送

DeepSeek-R1-Lite-Preview所属的领域
自然语言处理

自然语言处理

Natural Language Process

35个资源

DeepSeek-R1-Lite-Preview相关的任务