大模型的发展速度很快,对于需要学习部署使用大模型的人来说,显卡是一个必不可少的资源。使用公有云租用显卡对于初学者和技术验证来说成本很划算。DataLearnerAI在此推荐一个国内的合法的按分钟计费的4090显卡公有云服务提供商仙宫云,可以按分钟租用24GB显存的4090显卡公有云实例,非常具有吸引力~
文中整理和总结了几个关于开源大模型微调方面的问题,答案主要来自gpt4 + google,如果其中部分问题的答案不准确,烦劳指正 (文中引用了外部资源链接,如果涉及版权问题,烦劳联系作者删除)
Author Topic Model[ATM理解及公式推导]
生成对抗网络简介(包含TensorFlow代码示例)【翻译】
SlimPajama:CerebrasAI开源最新可商用的高质量大语言模型训练数据集,含6270亿个tokens!
JetBrains的IDEA打包可执行Jar文件以及maven的依赖的方法
Dirichlet Process and Stick-Breaking(DP的Stick-breaking 构造)
“GPT”的模型太多无法选择?让大模型帮你选择大模型!浙江大学发布HuggingGPT!
智谱AI与清华大学联合发布第三代基座大语言模型ChatGLM3:6B版本的ChatGLM3能力大幅增强,依然免费商用授权!