模型详细情况和参数
SQLCoder:自然语言转SQL的新星
SQLCoder 是 Defog 团队推出的一款前沿的语言模型,专门用于将自然语言问题转化为 SQL 查询。这是一个拥有150亿参数的模型,在自然语言到 SQL 生成任务上,其性能略微超过了 gpt-3.5-turbo 并且显著地超越了所有流行的开源模型。更令人震惊的是,尽管 SQLCoder 的大小只有 text-davinci-003 的十分之一,但其性能却远超后者。
需要注意的是,目前SQLCoder是基于StarCoder(StarCoder参考: https://www.datalearner.com/ai-models/pretrained-models/StarCoder )微调得到。它的代码开源协议是Apache 2.0,而模型预训练结果的开源协议是CC BY-SA-4.0并加上OpenRAIL-M clauses for responsible协议,运行大家免费商用。但是,如果你修改了该模型的权重,则必须也按照CC BY-SA-4.0协议开源,这意味着修改具有传染性!商用的用户需要注意!
SQLCoder的生成SQL准确率的测试如下:
model | perc_correct |
---|---|
gpt-4 | 74.3 |
defog-sqlcoder | 64.6 |
gpt-3.5-turbo | 60.6 |
defog-easysql | 57.1 |
text-davinci-003 | 54.3 |
wizardcoder | 52.0 |
starcoder | 45.1 |
SQLCoder 不仅为自然语言到 SQL 的转换任务设定了新的标准,而且展示了 Defog 团队在自然语言处理领域的卓越能力。对于那些希望将自然语言查询转化为 SQL 查询的开发者和研究者来说,这无疑是一个值得关注的工具。
SQLCoder详细简介: https://www.datalearner.com/blog/1051692667851329
SQLCoder的在线演示地址: https://defog.ai/sqlcoder-demo/