利用python进行数据分析——pandas层次化索引

层次化索引是pandas的一项重要功能,它使你在一个轴上拥有多个索引级别。

  • MultiIndex的建立与使用

利用python进行数据分析——pandas层次化索引

层次化索引在数据重塑和基于分组的操作中扮演者重要角色:

  • unstack方法将层次化索引的Series重塑为一个DataFrame
  • stack方法是unstack方法的逆运算

对于DataFrame来说,每条轴都可以有分层索引

利用python进行数据分析——pandas层次化索引

  •  重排分级顺序

         swaplevel:调整分级顺序

利用python进行数据分析——pandas层次化索引

利用python进行数据分析——pandas层次化索引

  • 根据多重索引进行排序 

        sort_index:根据级别中的值对数据进行排序

利用python进行数据分析——pandas层次化索引

利用python进行数据分析——pandas层次化索引

  •  根据multiindex级别进行汇总统计

        许多DataFrame和Series的描述和汇总统计上都有一个level选项,用于指定在某条轴上汇总的级别

利用python进行数据分析——pandas层次化索引

  •  索引与列的切换

人们经常想要将DataFrame的一个或多个列当做行索引来用,或者可能希望将行索引变为DataFrame的列

  1. set_index:将列变为索引
  2. reset_index:将索引边为列

利用python进行数据分析——pandas层次化索引

 

上一篇:Python Pandas的使用 !!!!!详解


下一篇:pandas dataframe 与 spark dataframe 互相转换(数据类型应该怎么转换呢?)