StarCoder

Name: StarCoder
Price: 免费商用授权
Rating: 5

编程大模型

StarCoder

发布时间: 2023-05-05

GitHub Hugging Face 在线体验

模型参数（Parameters）

155.0

最高上下文长度（Context Length）

是否支持中文

不支持

推理能力（Reasoning）

模型基本信息

是否支持推理过程

不支持

最高上下文输入长度

2K tokens

最长输出结果

暂无数据

模型类型

编程大模型

发布时间

2023-05-05

模型预文件大小

64GB

开源和体验地址

代码开源状态

Apache 2.0

预训练权重开源

BigCode OpenRAIL-M v1 - 免费商用授权

GitHub 源码

https://github.com/bigcode-project/starcoder/tree/main

Hugging Face

https://huggingface.co/bigcode/starcoder

在线体验

暂无在线体验地址

官方介绍与博客

官方论文

Star Coder: May the Source be With You!

DataLearnerAI博客

暂无介绍博客

API接口信息

接口速度（满分5分）

暂无数据

接口价格

输入价格:

文本: 暂无数据
图片: 暂无数据
音频: 暂无数据
视频: 暂无数据
Embedding: 暂无数据

输出价格:

文本: 暂无数据
图片: 暂无数据
音频: 暂无数据
视频: 暂无数据
Embedding: 暂无数据

输入支持的模态

文本

输入不支持

图片

输入不支持

视频

输入不支持

音频

输入不支持

Embedding（向量）

输入不支持

输出支持的模态

文本

输出不支持

图片

输出不支持

视频

输出不支持

音频

输出不支持

Embedding（向量）

输出不支持

StarCoder模型在各大评测榜单的评分

评测基准名称

评测类型

评测结果

发布机构

BigCode

查看发布机构详情

模型介绍

💫 StarCoder是一种基于源代码和自然语言文本训练的语言模型（LM）。它的训练数据包含了80多种不同的编程语言，以及从GitHub问题和提交以及notebook中提取的文本数据。

StarCoder简介

StarCoder是基于GitHub数据训练的一个代码补全大模型。可以实现一个方法或者补全一行代码。模型训练的数据来自Stack v1.2，这是一个收集自GitHub的包含很多代码的数据集。StarCoder的context长度是8192个tokens。

需要注意的是，这个模型不是一个指令模型（instruction model），因此，如果你输入“写一个求平方根的方法”这样的文本是无法获得正确结果的。它所做的主要是代码补全。不过，你也可以使用Tech Assistant prompt来让它有类似的能力。这是一个可以让StarCoder变成类似助理的数据集。

StarCoder使用方法

StarCoder生成代码实例

# pip install -q transformers



    
    

    
    
      
        
          关注DataLearnerAI公众号
          关注DataLearnerAI微信公众号，接受最新大模型资讯