St

StarCoder

编程大模型

StarCoder

发布时间: 2023-05-05

模型参数(Parameters)
155.0
最高上下文长度(Context Length)
2K
是否支持中文
不支持
推理能力(Reasoning)

模型基本信息

最高上下文输入长度

2K tokens

最长输出结果
未披露
模型类型

编程大模型

发布时间

2023-05-05

模型预文件大小

64GB

开源和体验地址

代码开源状态
预训练权重开源
BigCode OpenRAIL-M v1 - 免费商用授权
GitHub 源码
Hugging Face
在线体验
暂无在线体验地址

官方介绍与博客

官方论文
DataLearnerAI博客
暂无介绍博客

API接口信息

接口速度
暂无数据
接口价格
输入价格:
  • 文本: 暂无数据
  • 图片: 暂无数据
  • 音频: 暂无数据
  • 视频: 暂无数据
  • Embedding: 暂无数据
输出价格:
  • 文本: 暂无数据
  • 图片: 暂无数据
  • 音频: 暂无数据
  • 视频: 暂无数据
  • Embedding: 暂无数据

输入支持的模态

文本

输入不支持

图片

输入不支持

视频

输入不支持

音频

输入不支持

Embedding(向量)

输入不支持

输出支持的模态

文本

输出不支持

图片

输出不支持

视频

输出不支持

音频

输出不支持

Embedding(向量)

输出不支持

StarCoder模型在各大评测榜单的评分

发布机构

模型介绍

💫 StarCoder是一种基于源代码和自然语言文本训练的语言模型(LM)。它的训练数据包含了80多种不同的编程语言,以及从GitHub问题和提交以及notebook中提取的文本数据。


StarCoder简介


StarCoder是基于GitHub数据训练的一个代码补全大模型。可以实现一个方法或者补全一行代码。模型训练的数据来自Stack v1.2,这是一个收集自GitHub的包含很多代码的数据集。StarCoder的context长度是8192个tokens。


需要注意的是,这个模型不是一个指令模型(instruction model),因此,如果你输入“写一个求平方根的方法”这样的文本是无法获得正确结果的。它所做的主要是代码补全。不过,你也可以使用Tech Assistant prompt来让它有类似的能力。这是一个可以让StarCoder变成类似助理的数据集。


StarCoder使用方法

StarCoder生成代码实例


# pip install -q transformers

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat