pandas时间频率处理——resample和reindex方法

《pandas时间频率处理——resample和reindex方法》

简介

本文接着介绍时间频率转换重新对齐的两个方法( resample 和 reindex )。

resample()方法

resample 主要用于将数据转换到固定频率。先来看一个例子:

在这里我们创建了一个Series,使用 date_range 产生周期索引,频率 'W-SAT' 表示按每周的星期六开始为一个周期,所以第一个星期六为 2018-12-08 ,第二个为 2018-12-15 ,以此类推。

接着重采样到工作日频率:

可以传入 fill_method 参数控制填充 NaN的方法:

通过 resample 方法改变周期频率后,还能使用一些简单的计算方法:

可以看出重采样以 '3T' 作为频率后,再通过 sum 计算每三分钟的总和。

reindex()方法

我们知道当直接对两个Series进行加和时,会根据对应的索引值对齐加和:

就像上面的那样,只有索引值相同,并且非 NaN 值才会有结果。

如果此时想将 c 中的值加到 d 中去并保持 d 的日期索引,就可以使用 reindex 方法:

重新对齐索引后,会产生 NaN 值,通过 method 选择填充方法,变成一样的索引值后就能相加了。

总结

本文介绍了处理时间序列的两种方法:一种是重采样 resample 方法,能改变周期频率;另一种是重索引 reindex 方法,可以用来对齐时间索引,方便运算。

点赞

发表评论

电子邮件地址不会被公开。 必填项已用*标注

19 + 10 =