StarCodeBase
编程大模型StarCodeBase
模型参数
155亿
上下文长度
2K
中文支持
不支持
推理能力
StarCodeBase 是由 BigCode 发布的 AI 模型,发布时间为 2023-05-04,定位为 编程大模型,参数规模约为 155亿,上下文长度为 2K,模型文件大小约 64,采用 BigCode OpenRAIL-M v1 许可。
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
StarCodeBase
模型基本信息
推理过程
不支持
思考模式
不支持思考模式
上下文长度
2K tokens
最大输出长度
暂无数据
模型类型
编程大模型
输入/输出模态
暂无数据
发布时间
2023-05-04
模型文件大小
64
MoE架构
否
总参数 / 激活参数
155亿 / 不涉及
知识截止
暂无数据
StarCodeBase
开源和体验地址
StarCodeBase
官方介绍与博客
DataLearnerAI博客
暂无介绍博客
StarCodeBase
API接口信息
接口速度
暂无数据
暂无公开的 API 定价信息。
StarCodeBase
评测结果
当前尚无可展示的评测数据。
和其他模型对比
暂时没有为该模型整理的相关对比页面。
想自定义其他组合?打开对比工具
StarCodeBase
发布机构
BigCode
查看发布机构详情 StarCodeBase
模型解读
StarCodeBase与StarCode一样,都是来自BigCode的开源编程大模型。二者都是GPT-2的架构,唯一的区别是StarCodeBase是在80多种编程语言上训练的,基于1万亿tokens的数据集训练。而StarCode则是前面基础上,继续在350亿的python tokens上训练。
DataLearner 官方微信
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
