标签:AI,SQLCoder2,SQLCoder-7B,开源,性能评估 时间:2023-11-26T21:33:10
SQLCoder2与SQLCoder-7B是最新开源的两款模型,它们代表了在处理SQL查询方面的重大进步。SQLCoder2基于原始SQLCoder模型进行了显著改进,而SQLCoder-7B则是首个7B参数规模的模型,几乎与SQLCoder2有相同的性能表现。
SQLCoder2是一款15B参数的大型语言模型(LLM),它是StarCoder模型的微调实现版本。SQLCoder-7B则是基于Mistral-7B模型的微调实现。这两个模型都经过了手工制作的SQL查询的微调,难度逐渐增大。
这些模型的训练过程和数据挑选都进行了精心的调整,以解决原始SQLCoder在处理日期时间函数时的困难,以及有时会幻想出列名或表名的问题。此外,社区对能够部署在较小GPU上的小型模型有很大需求,而不是需要30GB或更多GPU VRAM才能运行的15B参数模型。
在开源评估框架中,SQLCoder在训练中未见过的新模式上超越了所有可用的大型语言模型,除了GPT-4。当这些模型针对特定模式进行微调时,其性能显著优于GPT-4。
SQLCoder2与SQLCoder-7B模型的发布,不仅解决了原模型的一些问题,还为生产环境中的使用提供了更合适的选择。这两款模型的开源,意味着用户可以更方便地访问和使用它们,无论是通过GitHub还是Huggingface,都可以找到模型权重。同时,用户也可以通过提供的交互式演示来在线体验模型。
原文链接:SQLCoder2 and SQLCoder-7B ReleaseGitHub链接:SQLCoder GitHub RepoHuggingface链接:SQLCoder on Huggingface交互式演示:SQLCoder Interactive Demo
2022年必读的AI论文——100个AI领域被引最多的论文分析
2022年被引次数最多的AI论文列表
生成式AI平台的玩家都有哪些?
斯坦福2022年度AI指数报告简介及下载链接
亚马逊最新发布Feature Store简介
大模型领域最著名开源模型小羊驼Vicuna升级!Vicuna发布1.5版本,可以免费商用了!最高支持16K上下文!
开源界最新力作!230万篇arXiv的论文标题和摘要的所有embeddings向量数据集免费开放!
OpenAI开源GPT-2的子词标记化神器——tiktoken,一个超级快的(Byte Pair Encoder,BPE)字节对编码Python库
重磅!Meta将PyTorch移交给Linux基金会!
全球主要开源组织概述
Bloomberg发布的最新的memray——Python内存分析器是什么?
全球最大(最挣钱)的十大开源企业
Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
回归模型中的交互项简介(Interactions in Regression)
贝塔分布(Beta Distribution)简介及其应用
矩母函数简介(Moment-generating function)
使用R语言进行K-means聚类并分析结果
普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程
H5文件简介和使用
深度学习技巧之Early Stopping(早停法)
手把手教你本地部署清华大学的ChatGLM-6B模型——Windows+6GB显卡本地部署
Wishart分布简介