大模型的发展速度很快,对于需要学习部署使用大模型的人来说,显卡是一个必不可少的资源。使用公有云租用显卡对于初学者和技术验证来说成本很划算。DataLearnerAI在此推荐一个国内的合法的按分钟计费的4090显卡公有云服务提供商仙宫云,可以按分钟租用24GB显存的4090显卡公有云实例,非常具有吸引力~
codeFest2018比赛的冠军解决方案——自然语言处理/计算机视觉/机器学习
Java爬虫入门简介(五)——抓包工具的使用以及使用HttpClient模拟用户登录的访问
OpenAI开源大模型调测工具Transformer Debugger(TDB):可以在训练大模型之前理解模型的运行情况并干预
开源模型进展迅猛!最新开源不可商用模型Command R+在大模型匿名投票得分上已经超过GPT-4-Turbo!
《Effective Java 第三版》笔记之六 避免创建不必要的对象
tf.nn.softmax_cross_entropy_with_logits函数
扩散模型是如何工作的:从0开始的数学原理——How diffusion models work: the math from scratch
阿里巴巴开源国内最大参数规模大语言模型——高达720亿参数规模的Qwen-72B发布!还有一个可以在手机上运行的18亿参数的Qwen-1.8B
除了Mistral-7B-MoE外,MistralAI还有更强大的模型,未宣布的Mistral-medium比混合专家模型更强!