SQ

SQLCoder

编程大模型

SQLCoder

发布时间: 2023-08-20

模型参数(Parameters)
150.0
最高上下文长度(Context Length)
2K
是否支持中文
不支持
推理能力(Reasoning)

模型基本信息

最高上下文输入长度

2K tokens

最长输出结果
未披露
模型类型

编程大模型

发布时间

2023-08-20

模型预文件大小

30GB

开源和体验地址

代码开源状态
预训练权重开源
CC BY-SA-4.0 - 免费商用授权
GitHub 源码
Hugging Face
在线体验
暂无在线体验地址

官方介绍与博客

官方论文
DataLearnerAI博客
暂无介绍博客

API接口信息

接口速度
暂无数据
接口价格
输入价格:
  • 文本: 暂无数据
  • 图片: 暂无数据
  • 音频: 暂无数据
  • 视频: 暂无数据
  • Embedding: 暂无数据
输出价格:
  • 文本: 暂无数据
  • 图片: 暂无数据
  • 音频: 暂无数据
  • 视频: 暂无数据
  • Embedding: 暂无数据

输入支持的模态

文本

输入不支持

图片

输入不支持

视频

输入不支持

音频

输入不支持

Embedding(向量)

输入不支持

输出支持的模态

文本

输出不支持

图片

输出不支持

视频

输出不支持

音频

输出不支持

Embedding(向量)

输出不支持

SQLCoder模型在各大评测榜单的评分

发布机构

模型介绍

SQLCoder:自然语言转SQL的新星


SQLCoder简介

SQLCoder 是 Defog 团队推出的一款前沿的语言模型,专门用于将自然语言问题转化为 SQL 查询。这是一个拥有150亿参数的模型,在自然语言到 SQL 生成任务上,其性能略微超过了 gpt-3.5-turbo 并且显著地超越了所有流行的开源模型。更令人震惊的是,尽管 SQLCoder 的大小只有 text-davinci-003 的十分之一,但其性能却远超后者。


需要注意的是,目前SQLCoder是基于StarCoder(StarCoder参考: https://www.datalearner.com/ai-models/pretrained-models/StarCoder )微调得到。它的代码开源协议是Apache 2.0,而模型预训练结果的开源协议是CC BY-SA-4.0并加上OpenRAIL-M clauses for responsible协议,运行大家免费商用。但是,如果你修改了该模型的权重,则必须也按照CC BY-SA-4.0协议开源,这意味着修改具有传染性!商用的用户需要注意!


SQLCoder的评测结果


SQLCoder的生成SQL准确率的测试如下:


modelperc_correct
gpt-474.3
defog-sqlcoder64.6
gpt-3.5-turbo60.6
defog-easysql57.1
text-davinci-00354.3
wizardcoder52.0
starcoder45.1



SQLCoder主要特点

  1. 性能对比:在 SQL 生成任务的评估框架上,SQLCoder(64.6%)的性能略微超过了 gpt-3.5-turbo(60.6%)。
  2. 训练数据:Defog 在两个周期内对10,537个人工策划的问题进行了训练,这些问题基于10种不同的模式。
  3. 使用方法:用户可以通过 transformers 库使用 SQLCoder,只需从 HuggingFace 仓库下载模型权重即可。此外,还提供了在线演示和 Colab 中的使用方法。
  4. 硬件要求:SQLCoder 已在 A100 40GB GPU 上进行了测试,并支持 bfloat16 权重。用户还可以在拥有20GB或更多内存的消费级 GPU 上加载模型的8位量化版本,例如 RTX 4090、RTX 3090 和 Apple M2 系列芯片。


SQLCoder未来计划

  • 开源 v1 模型权重(目前已经OK)。
  • 在更多数据上训练模型,增加数据的差异性。
  • 使用奖励建模和 RLHF 进一步调整模型。
  • 从头开始预训练一个专门用于 SQL 分析的模型。


SQLCoder总结

SQLCoder 不仅为自然语言到 SQL 的转换任务设定了新的标准,而且展示了 Defog 团队在自然语言处理领域的卓越能力。对于那些希望将自然语言查询转化为 SQL 查询的开发者和研究者来说,这无疑是一个值得关注的工具。


SQLCoder的资源地址


SQLCoder详细简介: https://www.datalearner.com/blog/1051692667851329 

SQLCoder的在线演示地址: https://defog.ai/sqlcoder-demo/ 

Foundation Model

StarCoder

StarCoder

View Details

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat