StarCodeBase - StarCodeBase

模型详细情况和参数

StarCodeBase

模型全称
StarCodeBase
模型简称
StarCodeBase
模型类型
发布日期
2023-05-04
预训练文件大小
64
模型参数数量(亿)
155
代码是否开源
预训练结果是否开源
预训练结果商用授权情况
发布论文名(官方博客名)
💫StarCoder: May the source be with you!
基础模型
无基础模型
发布机构

StarCodeBase 简介

StarCodeBase与StarCode一样,都是来自BigCode的开源编程大模型。二者都是GPT-2的架构,唯一的区别是StarCodeBase是在80多种编程语言上训练的,基于1万亿tokens的数据集训练。而StarCode则是前面基础上,继续在350亿的python tokens上训练。



欢迎大家关注DataLearner官方微信,接受最新的AI模型和技术推送

StarCodeBase所属的领域
自然语言处理

自然语言处理

Natural Language Process

35个资源

StarCodeBase相关的任务
代码补全

代码补全

Code Completion

35个资源