标签:#图像文本对##数据集##科研数据# 时间:2022/09/14 11:14:02 作者:小木
Google发布迄今为止公开可用的最大的多语言网络数据集MADLAD-400,覆盖419种语言
MetaAI开源高质量高精度标注的图像数据集FACET:3.2万张图片、5万个主题,平均图像解析度达到1500×2000
AI2发布全新的大语言模型预训练数据集:包含3万亿tokens的大规模文本数据集AI2 Dolma,开源免费商用数据集~
Saleforce发布最新的开源语言-视觉处理深度学习库LAVIS
重磅数据集分享:大规模多模态语料库之悟道数据集(WuDaoCorpora 2.0)
Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
回归模型中的交互项简介(Interactions in Regression)
贝塔分布(Beta Distribution)简介及其应用
矩母函数简介(Moment-generating function)
使用R语言进行K-means聚类并分析结果
普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程
H5文件简介和使用
深度学习技巧之Early Stopping(早停法)
手把手教你本地部署清华大学的ChatGLM-6B模型——Windows+6GB显卡本地部署
Wishart分布简介