Ki

Kimi k1.5 (Short-CoT)

推理大模型

Kimi k1.5 (Short-CoT)

发布时间: 2025-01-22

模型参数(Parameters)
未披露
最高上下文长度(Context Length)
128K
是否支持中文
支持
推理能力(Reasoning)

模型基本信息

最高上下文输入长度

128K tokens

最长输出结果
未披露
模型类型

推理大模型

发布时间

2025-01-22

模型预文件大小
暂无数据

开源和体验地址

代码开源状态
预训练权重开源
不开源 - 不开源
GitHub 源码
Hugging Face
暂无开源HuggingFace地址
在线体验
暂无在线体验地址

官方介绍与博客

官方论文
DataLearnerAI博客
暂无介绍博客

API接口信息

接口速度
暂无数据
接口价格
输入价格:
  • 文本: 暂无数据
  • 图片: 暂无数据
  • 音频: 暂无数据
  • 视频: 暂无数据
  • Embedding: 暂无数据
输出价格:
  • 文本: 暂无数据
  • 图片: 暂无数据
  • 音频: 暂无数据
  • 视频: 暂无数据
  • Embedding: 暂无数据

输入支持的模态

文本

输入不支持

图片

输入不支持

视频

输入不支持

音频

输入不支持

Embedding(向量)

输入不支持

输出支持的模态

文本

输出不支持

图片

输出不支持

视频

输出不支持

音频

输出不支持

Embedding(向量)

输出不支持

Kimi k1.5 (Short-CoT)模型在各大评测榜单的评分

评测基准名称
MMLU
(知识问答)
评测结果:87.4
评测基准名称
MATH-500
(数学推理)
评测结果:94.6

发布机构

模型介绍

Kimi 1.5月之暗面(Kimi)团队发布的一款多模态推理大语言模型,旨在通过强化学习(RL)和多模态数据处理,提升推理能力。Kimi 1.5有多个版本,其中Short-CoT(短链式推理)模型以高效和精简的推理能力脱颖而出。

Short-CoT模型特点

Kimi 1.5 Short-CoT版本专注于快速、简洁的推理,在计算资源有限的场景下表现优异。相比其他更复杂的版本,Short-CoT模型在推理步骤上进行了优化,减少了上下文窗口的长度,重点解决简单和中等复杂度的任务。

  1. 高效推理:通过强化学习和课程采样,模型从简单任务逐步过渡到复杂任务,确保训练过程高效并且避免了过度计算。
  2. 多模态处理:不仅处理文本数据,Short-CoT还能够处理视觉任务,适应需要图文结合的推理任务,例如MathVistaMMMU等。
  3. 推理简化:通过长度惩罚机制,模型避免了冗长推理,确保在最短时间内给出准确答案。

基准测试结果

Kimi 1.5 Short-CoT在多个标准基准测试中的表现非常出色:

  • MATH-500:得分94.6,显示出强大的数学推理能力。
  • AIME 2024Pass@1得分60.8,在数学挑战中优于多数同类模型。
  • HumanEval-MulPass@1得分81.5,在编程任务中表现出色。

Claude 3.5GPT-4o等主流模型相比,Kimi 1.5 Short-CoT在多个任务中提供了更高的准确性和更快的推理速度。

应用前景

由于其高效的推理和跨模态能力,Kimi 1.5 Short-CoT非常适合应用于需要快速响应的领域,如客户服务教育辅导编程调试等场景。

结语

Kimi 1.5 Short-CoT结合了强化学习和优化的推理策略,在保证性能的同时,大幅提升了计算效率。其在推理准确性、速度和多模态能力上的优势,使其成为未来AI应用的理想选择。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat