模型详细情况和参数
CodeGemma是Google开源的一系列编程大模型,分为三个版本,CodeGemma-7B、CodeGemma-7B-IT和CodeGemma-2B,第一个模型也成为Gemma-7B-PT,这里的PT代表的是PyTorch,IT代表Instruct,做过指令微调。
CodeGemma-7B是基于Gemma-7B模型继续在代码数据集上训练得到的(新的数据包含5000亿tokens,有代码数据集、开源数学数据集以及合成数据),其代码能力得到了大幅增强!其相关信息如下:
自然语言处理
Natural Language Process
35个资源
代码补全
Code Completion