ST

StableLM

基础大模型

Stable Language Model

发布时间: 2023-04-20更新于: 2023-05-02 14:44:56.394623
模型参数
1750亿
上下文长度
2K
中文支持
不支持
推理能力

Stable Language Model 是由 Stability AI 发布的 AI 模型,发布时间为 2023-04-20,定位为 基础大模型,参数规模约为 1750亿,上下文长度为 2K。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

StableLM

模型基本信息

推理过程
不支持
思考模式
不支持思考模式
上下文长度
2K tokens
最大输出长度
暂无数据
模型类型
基础大模型
输入/输出模态
暂无数据
发布时间
2023-04-20
模型文件大小
暂无数据
MoE架构
总参数 / 激活参数
1750亿 / 不涉及
知识截止
暂无数据
StableLM

开源和体验地址

代码开源状态
暂无数据
预训练权重开源
暂无数据
在线体验
暂无在线体验地址
StableLM

官方介绍与博客

DataLearnerAI博客
暂无介绍博客
StableLM

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。
StableLM

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

StableLM

发布机构

Stable Language Model

模型解读

StableLM是StabilityAI开源的一个大语言模型。于2023年4月20日公布,目前属于开发中,只公布了部分版本模型训练结果。


StabilityAI是著名的开源软件Stable Diffusion的开发者,该系列模型完全开源,但是做的是文本生成图像方向。而本次发布的StableLM是StabilityAI的第一个开源的大语言模型。


该模型基于Pile数据训练,但是是一个新的Pile数据集,比原始的Pile数据集大3倍,包含约1.5万亿tokens,数据集目前没有公开,但是官方说后续在适当的时机会公布。模型训练的context长度是4096个。下图是官方提供的实际测试例子:



截止4月20日,StableLM的技术细节尚未公布!


StableLM系列包含2种模型,一个是基础模型,名字中包含base。另一种是使用斯坦福Alpaca的微调流程在5个对话数据集上的联合微调得到的结果,名字中包含tuned。上述五个对话数据集为:

  1. 斯坦福的Alpaca数据集
  2. Nomic-AI的GPT4All数据集
  3. ShareGPT52K数据集
  4. Databricks的Dolly数据集
  5. Anthropic的HH数据集


目前,StabilityAI确定在训练的模型由5个版本,分别是30亿参数、70亿参数、150亿参数、300亿参数、650亿参数。而1750亿参数规模的模型处于规划阶段:

规模StableLM-Base-AlphaStableLM-Tuned-Alpha训练的tokens数量具体参数大小演示地址
3Bcheckpointcheckpoint8000亿3,638,525,952
7Bcheckpointcheckpoint8000亿7,869,358,080Hugging Face
15B训练中(pending)
30B训练中(pending)
65B训练中(pending)
175B规划中


截止2023年4月20日,已经开放30亿参数和70亿参数规模的预训练结果(下载地址见上表)中base和tuned共4种模型。并在HuggingFace上提供了70亿参数规模的演示环境。


目前StableLM的能力包括:

  • 闲聊
  • 正式的写作(如邮件)
  • 创意写作(写诗)
  • 写代码(如代码补全、文本生成代码等)


StableLM遵守CC BY-SA-4.0协议,开发人员可以自由使用基础模型(包括商业目的)。


StableLM官方博客介绍: https://stability.ai/blog/stability-ai-launches-the-first-of-its-stablelm-suite-of-language-models 

StableLM的GitHub地址: https://github.com/Stability-AI/StableLM 

StableLM的HuggingFace演示地址: https://huggingface.co/spaces/stabilityai/stablelm-tuned-alpha-chat 



DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码