大规模语言模型（Large language models）也可以用来解决数学问题——Language Models are Multilingual Chain-of-Thought Reasoners

标签：大规模语言模型,大语言模型时间：2022-10-12 09:23:22.675 发布者：小木

论文名：Language Models are Multilingual Chain-of-Thought Reasoners

发布时间：2022年10月

原文摘要：我们评估了大型语言模型在多语言环境中的推理能力。我们通过将GSM8K数据集（Cobbe等人，2021年）中的250个小学数学问题手动翻译成10种不同类型的语言，引入多语言小学数学（MGSM）基准。我们发现，通过思维链提示解决MGSM问题的能力随着模型规模的增加而出现，而且模型具有惊人的强大的多语言推理能力，甚至在孟加拉语和斯瓦希里语等代表不足的语言中也是如此。最后，我们表明，语言模型的多语言推理能力延伸到其他任务，如常识推理和上下文语义判断。MGSM基准可在此https网址上公开获取。

大规模语言模型（Large language models）也可以用来解决数学问题——Language Models are Multilingual Chain-of-Thought Reasoners

论文名：Language Models are Multilingual Chain-of-Thought Reasoners

发布时间：2022年10月

论文地址：https://arxiv.org/abs/2210.03057

代码地址：https://github.com/google-research/url-nlp