标签:#transformer##预训练模型# 时间:2022/11/06 11:56:31 作者:小木
大语言模型的技术总结系列一:RNN与Transformer架构的区别以及为什么Transformer更好
好东西!Transformer入门神作手把手按行实现Transformer教程The Annotated Transformer2022版本来袭
强大的对象分割开源算法!Meta AI开源Segment Anything: Working(SAM)预训练大模型!
重磅!学术论文处理预训练大模型GALACTICA发布!
简单几步教你如何在搭建并使用DALL·E开源版本来基于文字生成图片
XLNet基本思想简介以及为什么它优于BERT
Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
回归模型中的交互项简介(Interactions in Regression)
贝塔分布(Beta Distribution)简介及其应用
矩母函数简介(Moment-generating function)
使用R语言进行K-means聚类并分析结果
普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程
H5文件简介和使用
深度学习技巧之Early Stopping(早停法)
手把手教你本地部署清华大学的ChatGLM-6B模型——Windows+6GB显卡本地部署
Wishart分布简介