SlimPajama是一个开源的大模型训练数据集。
发布者:Cerebras
发布时间:2023-06-09
官方网址:https://huggingface.co/datasets/cerebras/SlimPajama-627B
数据记录总数:6270
数据集大小:895GB
自然语言处理
Natural Language Process
35个资源
问答系统
Question Answering