模型详细情况和参数
Deepseek Vision-Language-7B-Chat简称Deepseek VL-7B-Chat,是DeepSeekAI开源的一个多模态大模型,可以理解图片。最高支持1024*1024分辨率图像的输入,是目前已知的支持最高图像解析度的多模态大模型之一。
Deepseek VL-7B-Chat是基于DeepSeek-LLM-7B-Chat版本进行训练的,是其中的指令微调过的版本。可以更加好的应用在聊天场景。
多模态学习
Multimodal Learning
35个资源