De

DeepSeek VL-1.3B-Base

多模态大模型

DeepSeek Vision-Language-1.3B-Base

发布时间: 2024-03-11

模型参数(Parameters)
13.0
最高上下文长度(Context Length)
4K
是否支持中文
支持
推理能力(Reasoning)

模型基本信息

是否支持推理过程

不支持

最高上下文输入长度

4K tokens

最长输出结果
暂无数据
模型类型

多模态大模型

发布时间

2024-03-11

模型预文件大小

2.6GB

开源和体验地址

代码开源状态
预训练权重开源
DEEPSEEK LICENSE AGREEMENT - 免费商用授权
GitHub 源码
Hugging Face
在线体验
暂无在线体验地址

官方介绍与博客

官方论文
DataLearnerAI博客
暂无介绍博客

API接口信息

接口速度(满分5分)
暂无数据
接口价格
输入价格:
  • 文本: 暂无数据
  • 图片: 暂无数据
  • 音频: 暂无数据
  • 视频: 暂无数据
  • Embedding: 暂无数据
输出价格:
  • 文本: 暂无数据
  • 图片: 暂无数据
  • 音频: 暂无数据
  • 视频: 暂无数据
  • Embedding: 暂无数据

输入支持的模态

文本

输入不支持

图片

输入不支持

视频

输入不支持

音频

输入不支持

Embedding(向量)

输入不支持

输出支持的模态

文本

输出不支持

图片

输出不支持

视频

输出不支持

音频

输出不支持

Embedding(向量)

输出不支持

DeepSeek VL-1.3B-Base模型在各大评测榜单的评分

发布机构

模型介绍

Deepseek Vision-Language-1.3B-Base简称Deepseek VL-1.3B-Base,是DeepSeekAI开源的一个多模态大模型,可以理解图片。是一个可以在移动端运行的图片理解的多模态大模型。最高支持384*384分辨率图像的输入,是目前已知的支持最高图像解析度的多模态大模型之一。


Deepseek VL-1.3B-Base是基于DeepSeek-LLM-1.3B-Base版本进行训练的,语言模型部分是在5000亿tokens数据集上训练得到,而整个Deepseek VL-1.3B-Base模型则是在4000亿图像-语言tokens数据集上训练得到的。这个版本是基础语言版本拓展而来,此外还有基于指令优化的模型进行训练得到的: https://www.datalearner.com/ai-models/pretrained-models/deepseek-vl-1_3b-chat 

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat