ChatGLM2-6B（Chat General Language Model 2 - 6B）详细信息 | 名称、简介、使用方法，开源情况，商用授权信息 | 数据学习(DataLearner)

ChatGLM2-6B - Chat General Language Model 2 - 6B

模型详细情况和参数

ChatGLM2-6B

模型全称: Chat General Language Model 2 - 6B
模型简称: ChatGLM2-6B
模型类型: 聊天大模型
发布日期: 2023-06-25
预训练文件大小: 12GB
是否支持中文（中文优化）: 是
最高支持的上下文长度: 32K
模型参数数量（亿）: 62.0
模型代码开源协议: Apache 2.0
预训练结果开源商用情况: ChatGLM2-6B Model License - 免费商用授权
模型GitHub链接: https://github.com/THUDM/ChatGLM2-6B
模型HuggingFace链接: https://huggingface.co/THUDM/chatglm2-6b
在线演示地址: 暂无
DataLearnerAI的模型介绍
官方博客论文: GLM: General Language Model Pretraining with Autoregressive Blank Infilling
基础模型: GLM
查看详情
发布机构: 智谱AI

Chat General Language Model 2 - 6B 简介

关于ChatGLM2-6B的详细介绍可以参考： https://www.datalearner.com/blog/1051687694704581

ChatGLM2-6B是清华大学知识工程和数据挖掘小组（Knowledge Engineering Group (KEG) & Data Mining at Tsinghua University）发布的ChatGLM-6B模型的第二代。于2023年6月25日发布。

相比较第一代的ChatGLM-6B，ChatGLM2-6B模型的性能更加强大，并支持更长的上下文。

ChatGLM2-6B 使用了 Multi-Query Attention，提高了生成速度。生成 2000 个字符的平均速度对比如下

Model	推理速度 (字符/秒)
ChatGLM-6B	31.49
ChatGLM2-6B	44.62

ChatGLM2-6B的推理显存需求：

量化等级	编码 2048 长度的最小显存	生成 8192 长度的最小显存
FP16 / BF16	13.1 GB	12.8 GB
INT8	8.2 GB	8.1 GB
INT4	5.5 GB	5.1 GB

ChatGLM2-6B模型的预训练文件下载地址

HuggingFace地址： https://huggingface.co/THUDM/chatglm2-6b/tree/main

清华大学云盘地址： https://cloud.tsinghua.edu.cn/d/674208019e314311ab5c/

注意，所有的bin文件都要下载，而且config.json也要下载，这个文件只能在HuggingFace上下载，缺少这个文件会报配置错误。

欢迎大家关注DataLearner官方微信，接受最新的AI模型和技术推送