大型语言模型的能力更进一步——谷歌发布可以做定量推理的语言模型!
时间:2022-07-01 15:04:48.504
论文名:Solving Quantitative Reasoning Problems with Language Models
发布时间:2022年6月
论文地址:https://arxiv.org/abs/2206.14858
代码地址:
原文摘要:语言模型在需要自然语言理解的广泛任务上取得了显著的表现。然而,最先进的模型通常都在与需要量化推理的任务作斗争,比如在大学层面解决数学、科学和工程问题。为了帮助缩小这一差距,我们引入了Minerva,这是一个在一般自然语言数据上预先训练并在技术内容上进一步训练的大型语言模型。该模型在不使用外部工具的情况下,在技术基准上实现了最先进的性能。我们还对物理、生物学、化学、经济学和其他需要量化推理的200多个本科问题进行了评估,发现该模型可以正确回答其中近三分之一的问题。