今天,一位年仅20岁的小哥willdepue 开源了230万arXiv论文的标题和摘要的embedding向量数据集,完全开源。该数据集包含截止2023年5月4日的所有arXiv上的论文标题和摘要的embedding结果,使用的是开源的Instructor XL抽取。未来将开放更多其它相关数据的embedding结果
OpenAI第二代DALL·E发布,可以使用自然语言创造和编辑图片的模型
深度学习模型训练将训练批次(batch)设置为2的指数是否有实际价值?
如何使用git从GitHub上下载项目、更新远端项目并提交本地的更改
重磅数据集公布!LAION-400-Million Open Dataset免费的4亿条图像-文本对数据( LAION-400M:English (image, text) pairs)
机器学习项目流程清单
对偶规划问题
dask的dataframe的值变成1和foo的解决方法
[翻译]应用到文本领域的卷积方法
最新发布!截止目前最强大的最高支持65k输入的开源可商用AI大模型:MPT-7B!
GPT-3最新的能力开放——自动重构和增强你的代码!
Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
回归模型中的交互项简介(Interactions in Regression)
贝塔分布(Beta Distribution)简介及其应用
矩母函数简介(Moment-generating function)
使用R语言进行K-means聚类并分析结果
普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程
H5文件简介和使用
深度学习技巧之Early Stopping(早停法)
Wishart分布简介
stata 用outreg2输出回归结果