pandas从入门到放弃——23个基本操作

《pandas从入门到放弃——23个基本操作》

简介

数据科学家George Seif分享了23个pandas基本操作,让我们一起来练练手。

默认导入pandas格式如下:

1. 读取csv格式文件

可以使用sep参数指定分割的方式,使用header参数选择是否获取columns列。

2.读取Excel格式文件

通过sheet_name参数指定读取的sheet

3.写入csv格式文件

将一个数据写入csv,可以指定分割符sep,以及是否把索引写入。

4.获取基本信息

代码演示:

获取基本信息在数据预处理阶段非常实用,可以看到所有数据的类型和大小。

5.统计信息

代码演示:

该方法可以显示数据的统计信息,获得数据的分布情况。

6.表格中打印DataFrame

首先要确保有tabulate库,导入方法为:

代码演示:

7.列出列名

代码演示:

8.删除缺失数据

该函数我们在pandas处理缺失数据中讲到了。

9.替换数据

value替换to_replace

代码演示:

10.检查缺失值

代码演示:

11.删除

drop()函数可以删除数据,默认axis=0

代码演示:

12.将对象转为浮点型

代码演示:

13.DataFrame转换为NumPy数组

代码演示:

14.获取前n行

代码演示:

15.定位数据

代码演示:

16.使用函数

代码演示:

17.重命名列

代码演示:

18.获得唯一的值

代码演示:

19.获取特定的列

代码演示:

20.计算

21.排序

代码演示:

22.布尔索引

代码演示:

23.选择特定的值

代码演示:

总结

pandas基本操作是很容易掌握的,但是一些高级的功能还是需要多多练习才能掌握。

点赞

发表评论

邮箱地址不会被公开。 必填项已用*标注

5 × 4 =