模型详细情况和参数
评测名称 | 评测能力方向 | 评测结果 |
---|---|---|
GPQA Diamond | 常识推理 | 49.0 |
MATH-500 | 数学推理 | 90.4 |
AIME 2024 | 数学推理 | 50.0 |
微软近期发布的 Phi-4-mini-instruct 模型是一款轻量级的开放性语言模型,属于 Phi-4 系列,并专注于多语言支持与高效推理能力。它在基于合成数据和公开网站数据进行训练时,特别注重高质量推理密集型数据。这款模型不仅具有较强的推理能力,还在多语言任务中表现出色,支持高达 128K tokens 的上下文长度。
Phi-4-multimodal-instruct (reasoning-trained)是经过思维链训练过的,其推理能力更强,其基座版本参考: https://www.datalearner.com/ai-models/pretrained-models/Phi-4-mini-instruct
不过,该模型仅仅在微软的技术报告中提及,并未开源发布。