大模型的发展速度很快,对于需要学习部署使用大模型的人来说,显卡是一个必不可少的资源。使用公有云租用显卡对于初学者和技术验证来说成本很划算。DataLearnerAI在此推荐一个国内的合法的按分钟计费的4090显卡公有云服务提供商仙宫云,可以按分钟租用24GB显存的4090显卡公有云实例,非常具有吸引力~
编程大模型是大语言模型的一个非常重要的应用。刚刚,清华大学系创业企业智谱AI开源了最新的一个编程大模型,CodeGeeX2-6B。这是基于ChatGLM2-6B微调的针对编程领域的大模型。
ChatGLM-6B是国产开源大模型领域最强大的的大语言模型。因其优秀的效果和较低的资源占用在国内引起了很多的关注。2023年6月25日,清华大学KEG和数据挖掘小组(THUDM)发布了第二代ChatGLM2-6B。
TensorRT-LLM:英伟达推出的专为提升大模型推理速度优化的全新框架
12倍推理速度提升!Meta AI开源全新的AI推理引擎AITemplate
超越Cross-Entropy Loss(交叉熵损失)的新损失函数——PolyLoss简介
2023年4月业界发布的重要20多个AI模型总结:OpenAssistant、Segment Anything Model、StableLM、AudioGPT等
能否用85000美元从头开始训练一个打败ChatGPT的模型,并在浏览器中运行?
SWE-bench Verified:提升 AI 模型在软件工程任务评估中的可靠性
如何基于Gradio构建生成式AI的应用:吴恩达联合HuggingFace推出最新1小时短课
HuggingFace开源语音识别模型Distil-Whisper,基于OpenAI的Whisper-V2模型蒸馏,速度快6倍,参数小49%!