St

Stable Code Instruct 3B

编程大模型

Stable Code Instruct 3B

发布时间: 2024-03-25

模型参数(Parameters)
30.0
最高上下文长度(Context Length)
2K
是否支持中文
不支持
推理能力(Reasoning)

模型基本信息

是否支持推理过程

不支持

最高上下文输入长度

2K tokens

最长输出结果
暂无数据
模型类型

编程大模型

发布时间

2024-03-25

模型预文件大小

6GB

开源和体验地址

代码开源状态
预训练权重开源
Stability AI Membership - 收费商用授权
GitHub 源码
暂无GitHub开源地址
Hugging Face
在线体验
暂无在线体验地址

官方介绍与博客

官方论文
DataLearnerAI博客
暂无介绍博客

API接口信息

接口速度(满分5分)
暂无数据
接口价格
输入价格:
  • 文本: 暂无数据
  • 图片: 暂无数据
  • 音频: 暂无数据
  • 视频: 暂无数据
  • Embedding: 暂无数据
输出价格:
  • 文本: 暂无数据
  • 图片: 暂无数据
  • 音频: 暂无数据
  • 视频: 暂无数据
  • Embedding: 暂无数据

输入支持的模态

文本

输入不支持

图片

输入不支持

视频

输入不支持

音频

输入不支持

Embedding(向量)

输入不支持

输出支持的模态

文本

输出不支持

图片

输出不支持

视频

输出不支持

音频

输出不支持

Embedding(向量)

输出不支持

Stable Code Instruct 3B模型在各大评测榜单的评分

发布机构

模型介绍

Stable Code Instruct 3B是基于Stable Code 3B进行微调后得到的指令型编程大模型。相比较专门的编程大模型,它通过自然语言提示,能够处理包括代码生成、数学计算和其他与软件开发相关的多种任务。该模型在30亿参数规模上提供了最先进的性能,并且在软件工程相关任务上与更大的模型如CodeLlama 7B Instruct和StarChat 15B相媲美。


下图是这个指令模型的演示:



性能与优势

Stable Code Instruct 3B在多个方面展现了其卓越的性能。它不仅在代码生成上表现出色,还在FIM(Fill in the Middle)任务、数据库查询、代码翻译、解释和创建方面展现了强大的能力。模型的指令调整功能使其能够理解并执行复杂的指令,从而在软件开发相关的复杂技术叙述处理上具有显著的能力。

语言支持与训练

该模型特别关注开发者广泛使用的编程语言,如Python、Javascript、Java、C、C++和Go。根据Stack Overflow 2023年的开发者调查,这些语言对开发者群体有着深远的影响。除了这些主要语言,Stable Code Instruct 3B还在其他广泛采用的语言上进行了训练,包括SQL、PHP和Rust。

技术细节

Stable Code Instruct 3B的关键技术特点包括对多种编程语言的支持、对复杂指令的遵循能力,以及它的硬件可访问性。模型的紧凑尺寸和低硬件需求使其对更广泛的受众来说都是可访问的。在MT-Bench上,Stable Code Instruct 3B表现也很好


开源与商业使用

Stable Code Instruct 3B的模型权重和代码已经开源在Hugging Face上,供开发者和研究人员下载和使用。对于商业用途,可以通过Stability AI Membership进行访问。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat