PandasTutor——一个用于可视化pandas操作的神器
2,409 阅读
pandas是Python中一个非常重要的分析工具,在数据处理方面应用非常广泛。但是,也是因为pandas包含的操作很多,所以初学者很多时候也不能特别能理解这些操作。

为了让初学者能够充分理解pandas中的操作,Pandas Tutor将pandas的操作变成可视化的过程,让我们充分理解这个过程。
这是一个web工具,需要我们在web页面上输入我们的代码。然后,这个页面就会展示这个操作的过程。例如,我们输入如下代码:
(dogs[dogs['size'] == 'medium']
.sort_values('type')
.groupby('type').median()
)
那么,在Jupyter中展示的结果如下:


那么,该如何理解这段代码呢?其实这里有几个步骤:先是过滤,选择size是medium的数据。然后排序,按照type字段排序。然后是分组,最后是聚合。
那么,使用PandasTutor展示的结果就是如下几个图:
首先就是从原始数据中挑选出size=medium的数据:




