DeepMind最新研究AlphaTensor发布——可以寻找更快求解矩阵相乘的AI系统
时间:2022-10-06 08:36:59.189
论文名:Discovering faster matrix multiplication algorithms with reinforcement learning
发布时间:2022年10月
论文地址:https://www.nature.com/articles/s41586-022-05172-4
代码地址:https://github.com/deepmind/alphatensor
原文摘要:提高基本计算的算法效率可以产生广泛的影响,因为它可以影响大量计算的整体速度。矩阵乘法就是这样一项原始任务,它出现在许多系统中--从神经网络到科学计算程序。使用机器学习自动发现算法提供了超越人类直觉的前景,并超越了目前人类设计的最佳算法。然而,自动发现算法的程序是复杂的,因为可能的算法的空间是巨大的。在这里,我们报告了一种基于AlphaZero1的深度强化学习方法,用于发现高效且可证明正确的任意矩阵的乘法算法。我们的代理,AlphaTensor,被训练来玩一个单人游戏,目标是在一个有限的因子空间内找到张量分解。AlphaTensor发现了许多矩阵大小的算法,其复杂性超过了最先进的算法。特别是在有限域中的4×4矩阵的情况下,AlphaTensor的算法改进了Strassen的两级算法,据我们所知,这是自50年前发现该算法以来第一次2。我们通过不同的用例进一步展示了AlphaTensor的灵活性:结构化矩阵乘法的算法具有最先进的复杂性,通过优化矩阵乘法在特定硬件上的运行时间,提高了实际效率。我们的结果强调了AlphaTensor有能力加速一系列问题的算法发现过程,并针对不同的标准进行优化。