简介 Python 代码速查表,每一张都是国外的大师总结的,非常实用!
Pandas合并多个excel文件到一个文件的不同sheet中
笔者最近需要合并多个xlsx格式的excel文件到一个文件中,并且按照文件名给不同的sheet命名。特记录如下。 方法 使用pandas.ExcelWriter对象创建一个合并后的文件名; 使用for循环通过pandas…
pandas数据作图方法
简介 Pandas自身也提供了作图的[crayon-64731a798ed0c844223061-i/] 方法,可以作各种图形。本文将详细介绍如何使用Pandas直接作一些常规的图。 折线图 控制作图的类型在[crayo…
pandas时间频率处理——resample和reindex方法
简介 本文接着介绍时间频率转换和重新对齐的两个方法([crayon-64731a798f71b946788881-i/] 和[crayon-64731a798f721676508808-i/] )。 resample()…
pandas时间序列处理——日期范围、频率、移动
简介 时间序列是一种非常重要的数据类型,在许多领域(金融、物理、经济、生态学)都有应用,它描述了多个时间点观察到的结果,形成一段时间序列。时间序列中的频率变化可以是定长或不定长的,幸运的是,pandas提供了一套完整的方…
pandas读写操作总结
简介 读写操作方便数据的迁移储存,pandas提供了非常丰富的接口,能够实现对二进制数据、文本文件、剪贴板内容、Excel、JSON格式、HTML格式和HDF5格式等数据的读写,操作非常方便。本文将介绍几个主要操作: C…
pandas函数应用——apply、applymap、map方法
简介 在pandas中,[crayon-64731a79920d2703043658-i/] 方法使用是非常灵活的,他比[crayon-64731a79920d9241374333-i/] 方法使用更自由。数据分析师日常…
pandas数据聚合方法——agg方法
简介 在之前的文章中我们就介绍了一些聚合方法,这些方法能够就地将数组转换成标量值。一些经过优化的groupby方法如下表所示: 然而并不是只能使用这些方法,我们还可以定义自己的聚合函数,在这里就需要使用到agg方法。 自…
pandas数据聚合与分组运算——groupby方法
简介 pandas中一类非常重要的操作是数据聚合与分组运算。通过groupby方法能够实现对数据集的拆分、统计、转换等操作,这个过程一气呵成。 在本文中,你将学到: 选取特定列分组; 对分组进行迭代; 通过字典或Seri…
pandas数据离散化
简介 有时候便于分析数据,我们需要将连续型的数据划分开,也就是离散化。比如:统计人员的年龄分布,需要划分几个档次等,然后就可以做柱状图或者直方图。可以通过pandas的cut()和qcut()函数实现,接下来一一介绍。 …
pandas去重、替换和重命名索引
简介 本文将介绍pandas的几个实用操作——去重、替换和重命名索引。 去除重复数据 在DataFrame中经常会碰到重复行数据,比如: [crayon-64731a79946b4601047167/] 使用duplic…
pandas重塑和轴向旋转
简介 pandas中重新排列表格型数据的操作称为重塑(reshape)和轴向旋转(pivot)。可以将一个高维的数据按照想要的方式二维平铺展开。 重塑 重塑操作方法有两个: stack():将数据的列旋转为行; unst…
pandas合并数据操作
简介 pandas提供了一套合并数据集操作的方法: pandas.merge()可根据一个或者多个键将不同的DataFrame连接在一起,类似于SQL数据库中的合并操作; pandas.concat()可以沿某个轴将多个…
pandas从入门到放弃——23个基本操作
简介 数据科学家George Seif分享了23个pandas基本操作,让我们一起来练练手。 默认导入pandas格式如下: [crayon-64731a7995bfe821648726/] 1. 读取csv格式文件 […
pandas索引和获取
简介 在pandas中最常见的操作就是索引和获取数据,在老版本中使用的ix方法已经被抛弃,转而代之的是loc和iloc方法。 Series操作 在Series中索引和获取的工作方式类似NumPy数组。示例如下: [cra…