CodeGemma-7B - CodeGemma-7B

模型详细情况和参数

CodeGemma-7B

模型全称
CodeGemma-7B
模型简称
CodeGemma-7B
模型类型
编程大模型
发布日期
2024-04-09
预训练文件大小
17.09GB
是否支持中文(中文优化)
最高支持的上下文长度
4K
模型参数数量(亿)
70.0
模型代码开源协议
Apache 2.0
预训练结果开源商用情况
Gemma Terms of Use - 免费商用授权
在线演示地址
暂无
基础模型
无基础模型
发布机构

CodeGemma-7B 简介

CodeGemma是Google开源的一系列编程大模型,分为三个版本,CodeGemma-7B、CodeGemma-7B-IT和CodeGemma-2B,第一个模型也成为Gemma-7B-PT,这里的PT代表的是PyTorch,IT代表Instruct,做过指令微调。


CodeGemma-7B是基于Gemma-7B模型继续在代码数据集上训练得到的(新的数据包含5000亿tokens,有代码数据集、开源数学数据集以及合成数据),其代码能力得到了大幅增强!其相关信息如下:

  • 参数量: 70亿
  • HumanEval 单行填充: 76.09%
  • HumanEval 多行填充: 58.44%
  • Python编程基准HumanEval: 44.5%
  • Python编程基准MBPP: 56.2%
  • GSM8K数学推理: 44.2%
  • MATH数学推理: 19.9%

欢迎大家关注DataLearner官方微信,接受最新的AI模型和技术推送

CodeGemma-7B所属的领域
自然语言处理

自然语言处理

Natural Language Process

35个资源

CodeGemma-7B相关的任务
代码补全

代码补全

Code Completion

35个资源