截止目前可能是全球最快的大语言模型推理服务:实机演示Groq公司每秒500个tokens输出的450亿参数的Mixtral 8×7B模型

标签:#Groq##LPU##大模型加速##大模型推理加速# 时间:2024/02/19 18:25:08 作者:小木

欢迎大家关注DataLearner官方微信,接受最新的AI技术推送