Large Language Model Meta AI - 3

Llama3是MetaAI开源的最新一代大语言模型,基于15万亿tokens的数据集训练,是最强的开源大模型

Llama3基本信息

模型发布时间: 2024-04-18

模型发布机构: Facebook AI研究实验室

模型所属类型: 自然语言处理

模型官方地址: https://ai.meta.com/blog/meta-llama-3/

Llama3大模型详细介绍



Llama系列基座模型的评测对比


70亿参数规模Llama系列大模型的评测对比

评测基准LLaMA-7BLlama2-7BLlama2-7B-InsLlama3-8BLlama3-8B-Ins
MMLU (5-shot)35.145.734.166.668.4
AGI Eval23.929.345.9
BIG-Bench Hard38.161.1
CommonSenseQA 57.672.6
Winogrande70.173.376.1
ARC-Challenge47.653.778.6
GPQA (0-shot)21.734.2
HumanEval (0-shot)7.962.2
GSM-8K (8-shot, CoT) 25.779.6
MATH (4-shot, CoT)3.830.0


700亿参数规模的Llama系列大模型评测对比

评测基准LLaMA-65BLlama2-70BLlama2-70B-InsLlama3-70BLlama3-70B-Ins
MMLU (5-shot)63.469.752.979.582.0
AGI Eval47.654.8-63-
BIG-Bench Hard -65.7-81.3-
CommonSenseQA  -78.7-83.8-
Winogrande77.081.8-83.1-
ARC-Challenge56.085.3-93.0-
GPQA (0-shot)--21.0-39.5
HumanEval (0-shot)--25.6-81.7
GSM-8K (8-shot, CoT) --57.7-93.0
MATH (4-shot, CoT)--11.6-50.4



三代Llama模型的训练时长明显增加:


参数规模/版本LLaMA-1Llama-2Llama-3
7B8.243218.432130
70B102.2362172.032640


欢迎大家关注DataLearner官方微信,接受最新的AI技术推送
datalearner-wechat
基于Llama3微调的模型列表