Qwen2.5-VL-32B-Instruct
发布时间: 2025-03-24
不支持
32K tokens
2048 tokens
多模态大模型
2025-03-24
64GB
输入支持
输入支持
输入不支持
输入不支持
输入不支持
输出支持
输出不支持
输出不支持
输出不支持
输出不支持
Qwen2.5-VL-32B-Instruct是通义千问团队于2025年3月24日开源的多模态大模型,基于Apache 2.0协议发布。该模型在Qwen2.5-VL系列基础上,通过强化学习技术优化,以32B参数规模实现多模态能力突破。
输出风格优化
模型输出内容在格式规范与信息详实度上更贴近人类表达习惯,特别是在复杂场景中能生成结构清晰、逻辑严密的解决方案。
数学推理突破
针对包含多变量方程、几何证明等复杂数学问题,模型通过算法优化将解题准确率提升至行业领先水平。
细粒度视觉分析
在医疗影像解析、工程图纸识别等专业领域,模型展现出像素级内容捕捉能力,并支持多图关联推理与时空维度分析。
在MMMU(多模态理解)、MathVista(视觉数学推理)等权威测试集上,该模型以32B参数规模超越Mistral-Small-3.1-24B、Gemma-3-27B-IT等同级竞品,其表现较前代72B模型Qwen2-VL-72B-Instruct提升达12.7%。
在用户体验导向的MM-MT-Bench评估中,模型在开放式问答、指令跟随等场景的响应质量获得显著优化,主观评分较前代提升19.4%。文本处理能力保持同参数规模顶尖水准,在MT-Bench文本基准测试中位列前三。
以用户提供的卡车限速场景为例,模型展现多模态协同能力:
该案例印证了模型在跨模态信息整合、专业领域知识应用以及可解释性输出方面的技术优势。
关注DataLearnerAI微信公众号,接受最新大模型资讯