《python数据分析》5.2.1~5.2.4

5.2.1 重建索引

reindex函数对Series和DataFrame进行重建索引

重建后,如果重建的标签和之前一样,则之前标签对应什么值就是什么值,如果是新标签,则对应的值是NaN,也可传入‘ffill’参数,

这样如果是NaN值,则赋值和前面的标签值一样。

当有重复标签名字的对象时,是不能调用reindex函数的。

reindex可以设置copy参数,当设置成False时,如果新标签表和之前的一模一样,就不复制了,节省空间和时间,反之复制。

 

5.2.2 删除条目

调用drop函数来删除对应的值。可以传入标签名;指定axis在哪个轴上删除

data
Out[31]: 
          one  two  three  four
Ohio        0    1      2     3
Colorado    4    5      6     7
Utah        8    9     10    11
New York   12   13     14    15

data.drop('two',axis=1)
Out[32]: 
          one  three  four
Ohio        0      2     3
Colorado    4      6     7
Utah        8     10    11
New York   12     14    15

  必须指定axis=1,这样才能在列表上删除two

drop是直接对原对象进行操作。

5.2.3 索引、过滤

类似python的切片操作:

obj[2:4],包含2,不包含4

如果用标签“切片”,则首尾都包含

 

loc函数输入的是标签名,iloc输入的是标签索引数值,data[:,clo], :,是所有行

 

上一篇:Python pandas.DataFrame.reindex函数方法的使用


下一篇:reindex简单使用学习总结,总结了在一些场景中使用reindex做Elasticsearch数据迁移的方式。