模型详细情况和参数
Yi-9B是李开复旗下零一万物最新开源的大语言模型。参数规模90亿,该模型是Yi-6B继续在0.8万亿tokens数据上训练得到。它更加擅长数学和代码生成能力。
与其它70亿参数规模的模型相比(如Mistral-7B、Gemma-7B等),它的数学和代码能力更强。在不牺牲理解能力的基础上,数学推理和代码能力相比Yi-6B都有较大的提升。
根据DataLearnerAI收集的资料,在70亿参数规模的模型综合能力对比中,Yi-9B模型的MMLU评测结果很优秀,而GSM8K和Math这类数学推理能力虽然比Yi-6B有提升,但是相比较Gemma 7B和ChatGLM3-6B,则没有明显的提升。
数据来源: https://www.datalearner.com/ai-models/llm-evaluation?modelSize=7b
但是代码能力方面,Yi-9B的表现则好很多。
数据来源: https://www.datalearner.com/ai-models/llm-coding-evaluation?modelSize=7b
相比较同级别的模型,Yi-9B表现好很多。也就是说Yi-9B属于综合能力不错,在代码方面有着很不错表现的大模型。