模型详细情况和参数
DeepSeek Vision-Language-7B-Base简称DeepSeek VL-7B-Base,是DeepSeekAI开源的一个多模态大模型,可以理解图片。最高支持1024*1024分辨率图像的输入,是目前已知的支持最高图像解析度的多模态大模型之一。
DeepSeek VL-7B-Base是基于DeepSeek-LLM-7B-Base版本进行训练的,是基础语言模型上增加图片理解能力,语言模型部分是基于2万亿tokens数据集预训练得到。而整个Deepseek Vision-Language-7B-Base则是再4000亿图像-语言tokens数据集上训练的。除了此处说的Base版本外,DeepSeek-VL模型还包括指令优化的版本: https://www.datalearner.com/ai-models/pretrained-models/deepseek-vl-7b-chat