DeepSeek VL-1.3B-Base

Name: DeepSeek Vision-Language-1.3B-Base
Price: 免费商用授权
Rating: 5

多模态大模型

DeepSeek Vision-Language-1.3B-Base

发布时间: 2024-03-11

GitHub Hugging Face 在线体验

模型参数（Parameters）

13.0

最高上下文长度（Context Length）

是否支持中文

支持

推理能力（Reasoning）

模型基本信息

是否支持推理过程

不支持

最高上下文输入长度

4K tokens

最长输出结果

暂无数据

模型类型

多模态大模型

发布时间

2024-03-11

模型预文件大小

2.6GB

开源和体验地址

代码开源状态

MIT License

预训练权重开源

DEEPSEEK LICENSE AGREEMENT - 免费商用授权

GitHub 源码

https://github.com/deepseek-ai/DeepSeek-VL

Hugging Face

https://huggingface.co/deepseek-ai/deepseek-vl-1.3b-base

在线体验

暂无在线体验地址

官方介绍与博客

官方论文

DeepSeek-VL: Towards Real-World Vision-Language Understanding

DataLearnerAI博客

暂无介绍博客

API接口信息

接口速度（满分5分）

暂无数据

接口价格

输入价格:

文本: 暂无数据
图片: 暂无数据
音频: 暂无数据
视频: 暂无数据
Embedding: 暂无数据

输出价格:

文本: 暂无数据
图片: 暂无数据
音频: 暂无数据
视频: 暂无数据
Embedding: 暂无数据

输入支持的模态

文本

输入不支持

图片

输入不支持

视频

输入不支持

音频

输入不支持

Embedding（向量）

输入不支持

输出支持的模态

文本

输出不支持

图片

输出不支持

视频

输出不支持

音频

输出不支持

Embedding（向量）

输出不支持

DeepSeek VL-1.3B-Base模型在各大评测榜单的评分

评测基准名称

评测类型

评测结果

发布机构

DeepSeek-AI

查看发布机构详情

模型介绍

Deepseek Vision-Language-1.3B-Base简称Deepseek VL-1.3B-Base，是DeepSeekAI开源的一个多模态大模型，可以理解图片。是一个可以在移动端运行的图片理解的多模态大模型。最高支持384*384分辨率图像的输入，是目前已知的支持最高图像解析度的多模态大模型之一。

Deepseek VL-1.3B-Base是基于DeepSeek-LLM-1.3B-Base版本进行训练的，语言模型部分是在5000亿tokens数据集上训练得到，而整个Deepseek VL-1.3B-Base模型则是在4000亿图像-语言tokens数据集上训练得到的。这个版本是基础语言版本拓展而来，此外还有基于指令优化的模型进行训练得到的： https://www.datalearner.com/ai-models/pretrained-models/deepseek-vl-1_3b-chat

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号，接受最新大模型资讯