大规模语言模型(Large language models)也可以用来解决数学问题——Language Models are Multilingual Chain-of-Thought Reasoners

标签:大规模语言模型,大语言模型 时间:2022-10-12 09:23:22.675 发布者:小木

论文名:Language Models are Multilingual Chain-of-Thought Reasoners
发布时间:2022年10月
论文地址:https://arxiv.org/abs/2210.03057
代码地址:https://github.com/google-research/url-nlp

原文摘要:我们评估了大型语言模型在多语言环境中的推理能力。我们通过将GSM8K数据集(Cobbe等人,2021年)中的250个小学数学问题手动翻译成10种不同类型的语言,引入多语言小学数学(MGSM)基准。我们发现,通过思维链提示解决MGSM问题的能力随着模型规模的增加而出现,而且模型具有惊人的强大的多语言推理能力,甚至在孟加拉语和斯瓦希里语等代表不足的语言中也是如此。最后,我们表明,语言模型的多语言推理能力延伸到其他任务,如常识推理和上下文语义判断。MGSM基准可在此https网址上公开获取。