Grok-0 - Grok-0

模型详细情况和参数

Grok-0

模型全称
Grok-0
模型简称
Grok-0
模型类型
聊天大模型
发布日期
2023-11-05
预训练文件大小
0
是否支持中文(中文优化)
最高支持的上下文长度
8K
模型参数数量(亿)
330.0
模型代码开源协议
不开源
预训练结果开源商用情况
不开源 - 不开源
模型GitHub链接
暂无
模型HuggingFace链接
暂无
在线演示地址
暂无
DataLearnerAI的模型介绍
官方博客论文
Announcing Grok
基础模型
无基础模型
发布机构

Grok-0 简介

Grok-0模型是xAI公司在开发Grok-1模型之前的一个原型版本。从您提供的博客内容中,我们可以看到Grok-0模型拥有33亿的参数,这个早期模型在标准的语言模型基准测试中接近LLaMa 2(70B)的能力,但只使用了一半的训练资源。Grok-0模型在某些基准测试中的表现如下:

  • GSM8k(中学数学词问题):56.8%
  • MMLU(多学科多选题):65.7%
  • HumanEval(Python代码完成任务):39.7%
  • MATH(中学和高中数学问题):15.7%

这些基准测试成绩显示了Grok-0在数学和编程任务中的表现。随后,在过去的两个月中,xAI团队对推理和编码能力进行了重大改进,开发出了Grok-1模型,该模型在HumanEval编码任务和MMLU任务中的表现分别提高到了63.2%和73%。通过对比Grok-0和Grok-1在这些基准测试中的表现,可以看出Grok-1在推理和编码能力上的明显提升。

欢迎大家关注DataLearner官方微信,接受最新的AI模型和技术推送

Grok-0所属的领域
自然语言处理

自然语言处理

Natural Language Process

35个资源

Grok-0相关的任务
问答系统

问答系统

Question Answering

35个资源