数据学习
登录
注册
原创博客
期刊会议
学术世界
期刊出版社
领域期刊
SCI/SCIE/SSCI/EI简介
期刊列表
会议列表
所有期刊分区
学术期刊信息检索
JCR期刊分区查询
CiteScore期刊分区查询
中科院期刊分区查询
领域期刊分区
管理 - UTD24期刊列表
管理 - AJG(ABS)期刊星级查询
管理 - FMS推荐期刊列表
计算机 - CCF推荐期刊会议列表
高校期刊分区
南大核心(CSSCI)
合工大小核心
合工大大核心
AI资源仓库
AI领域与任务
AI研究机构
AI学术期刊
AI论文快讯
AI数据集
AI开源工具
AI模型
AI模型概览图
AI模型月报
AI基础大模型
AI预训练大模型
数据推荐
网址导航
我的网址导航
程序员必备网站
PandasTutor——一个用于可视化pandas操作的神器
标签:
#pandas#
#python#
#编程#
时间:2021/12/05 19:40:35
作者:小木
pandas是Python中一个非常重要的分析工具,在数据处理方面应用非常广泛。但是,也是因为pandas包含的操作很多,所以初学者很多时候也不能特别能理解这些操作。

为了让初学者能够充分理解pandas中的操作,Pandas Tutor将pandas的操作变成可视化的过程,让我们充分理解这个过程。 这是一个web工具,需要我们在web页面上输入我们的代码。然后,这个页面就会展示这个操作的过程。例如,我们输入如下代码: ```python (dogs[dogs['size'] == 'medium'] .sort_values('type') .groupby('type').median() ) ``` 那么,在Jupyter中展示的结果如下:


那么,该如何理解这段代码呢?其实这里有几个步骤:先是过滤,选择size是medium的数据。然后排序,按照type字段排序。然后是分组,最后是聚合。 那么,使用PandasTutor展示的结果就是如下几个图: 首先就是从原始数据中挑选出size=medium的数据:

这个图展示了第一步从size字段选出medium的过程,接下来就是第二步:

可以看到,按照type排序之后得到右边的图。排序之后开始分组,分完组之后用不同的颜色块表示不同的分组,如下图所示。

最后就是取不同组中的中位数了,得到如下结果:

从上面的图我们可以看到,简单的几行pandas代码过程是比较复杂的,但是通过这个示意图我们可以看到整个pandas处理的过程。这对于我们学习pandas,理解其中的操作非常有用。目前这个工具包含了很多pandas操作的可视化(不止这些啊,需要的可以自己尝试): - 按行过滤 - 按列过滤 - 删除列 - 排序 - 分片 - 分组求和/均值 总的来说,这个工具对于pandas初学者来说十分的有用,而且由于还在项目开始阶段,成员非常希望获得大家的反馈。大家可以去自己尝试: https://pandastutor.com/
欢迎大家关注DataLearner官方微信,接受最新的AI技术推送
相关博客
最热博客