基于GPU的机器学习Python库——RAPIDS简介及其使用方法

随着深度学习的火热，对计算机算力的要求越来越高。从2012年AlexNet以来，人们越来越多开始使用GPU加速深度学习的计算。

然而，一些传统的机器学习方法对GPU的利用却很少，这浪费了很多的资源和探索的可能。在这里，我们介绍一个非常优秀的项目——RAPIDS，这是一个致力于将GPU加速带给传统算法的项目，并且提供了与Pandas和scikit-learn一致的用法和体验，非常值得大家尝试。如果需要使用传统机器学习方法处理大规模的数据，这是非常值得使用的库。这里列举的只是少部分功能，它的强大远远超过你的想象。

目前，RAPIDS提供三个模块处理数据：cuDF相当于Pandas，cuML相当于scikit-learn，cuGraph则是处理图数据的（如PageRank算法）。由于它的兼容性很好，我们可以把RAPIDS与深度学习框架结合，用cuDF来利用GPU加速处理数据，然后使用PyTorch的深度学习模型处理任务。这也是可以的。所以，它非常灵活而且强大。

RAPIDS在Medium上也有博客，介绍了很多使用RAPIDS处理任务的技巧，如使用RAPIDS处理金融数据、使用cuDF加速协同过滤等。链接可以看参考一章。

一、为什么使用GPU

相比较CPU而言，GPU是由很多个简单的核组成的计算单元，它可以并行处理很多个任务（而CPU是有较少的复杂的核心组成，执行序列任务，只能同时执行很少的线程）。同时，GPU也比CPU有更好的带宽优化。而深度学习的基本算子则是矩阵乘法、向量加减和单值运算，它的特点是基本算子计算简单，但是对算力的需求较高。这正好与GPU的特点相结合。因此，GPU是目前加速深度学习最合适的硬件。

基于GPU的机器学习Python库——RAPIDS简介及其使用方法

一、为什么使用GPU

DataLearner 官方微信

二、RAPIDS简介

2.1、cuDF

2.2、cuML

2.3、cuGraph

三、使用方法

热门博客