StarCodeBase
StarCodeBase 是由 BigCode 发布的 AI 模型,发布时间为 2023-05-04,定位为 编程大模型,参数规模约为 155.0B,上下文长度为 2K,模型文件大小约 64,采用 BigCode OpenRAIL-M v1 许可。
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
StarCodeBase与StarCode一样,都是来自BigCode的开源编程大模型。二者都是GPT-2的架构,唯一的区别是StarCodeBase是在80多种编程语言上训练的,基于1万亿tokens的数据集训练。而StarCode则是前面基础上,继续在350亿的python tokens上训练。
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
