ST

StableLM

基础大模型

Stable Language Model

发布时间: 2023-04-20更新于: 2023-05-02 14:44:56.394623

在线体验GitHub Hugging Face Compare

模型参数

1750亿

上下文长度

2K

中文支持

不支持

推理能力

Stable Language Model 是由 Stability AI 发布的 AI 模型，发布时间为 2023-04-20，定位为基础大模型，参数规模约为 1750亿，上下文长度为 2K。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

StableLM

模型基本信息

推理过程

不支持

思考模式

不支持思考模式

上下文长度

2K tokens

最大输出长度

暂无数据

模型类型

基础大模型

输入/输出模态

暂无数据

发布时间

2023-04-20

模型文件大小

暂无数据

MoE架构

否

总参数 / 激活参数

1750亿 / 不涉及

知识截止

暂无数据

StableLM

开源和体验地址

代码开源状态

暂无数据

预训练权重开源

暂无数据

GitHub 源码

https://github.com/Stability-AI/StableLM

Hugging Face

https://huggingface.co/spaces/stabilityai/stablelm-tuned-alpha-chat

在线体验

暂无在线体验地址

StableLM

官方介绍与博客

官方论文

Stability AI Launches the First of its StableLM Suite of Language Models

DataLearnerAI博客

暂无介绍博客

StableLM

API接口信息

接口速度

暂无数据

暂无公开的 API 定价信息。

StableLM

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

StableLM

发布机构

Stability AI

查看发布机构详情

Stable Language Model

模型解读

StableLM是StabilityAI开源的一个大语言模型。于2023年4月20日公布，目前属于开发中，只公布了部分版本模型训练结果。

StabilityAI是著名的开源软件Stable Diffusion的开发者，该系列模型完全开源，但是做的是文本生成图像方向。而本次发布的StableLM是StabilityAI的第一个开源的大语言模型。

该模型基于Pile数据训练，但是是一个新的Pile数据集，比原始的Pile数据集大3倍，包含约1.5万亿tokens，数据集目前没有公开，但是官方说后续在适当的时机会公布。模型训练的context长度是4096个。下图是官方提供的实际测试例子：

截止4月20日，StableLM的技术细节尚未公布！

StableLM系列包含2种模型，一个是基础模型，名字中包含base。另一种是使用斯坦福Alpaca的微调流程在5个对话数据集上的联合微调得到的结果，名字中包含tuned。上述五个对话数据集为：

斯坦福的Alpaca数据集
Nomic-AI的GPT4All数据集
ShareGPT52K数据集
Databricks的Dolly数据集
Anthropic的HH数据集

目前，StabilityAI确定在训练的模型由5个版本，分别是30亿参数、70亿参数、150亿参数、300亿参数、650亿参数。而1750亿参数规模的模型处于规划阶段：

规模	StableLM-Base-Alpha	StableLM-Tuned-Alpha	训练的tokens数量	具体参数大小	演示地址
3B	checkpoint	checkpoint	8000亿	3,638,525,952
7B	checkpoint	checkpoint	8000亿	7,869,358,080	Hugging Face
15B	训练中	(pending)
30B	训练中	(pending)
65B	训练中	(pending)
175B	规划中

截止2023年4月20日，已经开放30亿参数和70亿参数规模的预训练结果（下载地址见上表）中base和tuned共4种模型。并在HuggingFace上提供了70亿参数规模的演示环境。

目前StableLM的能力包括：

闲聊
正式的写作（如邮件）
创意写作（写诗）
写代码（如代码补全、文本生成代码等）

StableLM遵守CC BY-SA-4.0协议，开发人员可以自由使用基础模型（包括商业目的）。

StableLM官方博客介绍： https://stability.ai/blog/stability-ai-launches-the-first-of-its-stablelm-suite-of-language-models

StableLM的GitHub地址： https://github.com/Stability-AI/StableLM

StableLM的HuggingFace演示地址： https://huggingface.co/spaces/stabilityai/stablelm-tuned-alpha-chat

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送

DataLearner 官方微信二维码