Pandas之八Reshaping(一)

数据分析时,有时会要对数据做一些变形才能更好地分析,Pandas提供了灵活的方法应对该场景,包括stackpivot table

  • stack:将dataframe中的列转为行。
  • pivot table:数据透视表,功能比较丰富,大多数场景都可适用。

下面使用图中两套数据对这两个功能进行说明
Pandas之八Reshaping(一)

1. Stack

Stack提供了行转列与列转行的操作,使用.stack将列转为行,还可以使用.unstack将行转为列(stack的逆操作),返回的是SeriesDataFrame

1.1 Stack

将dataframe中指定level的列转为行,在上图数据列是单层,其列的level值既是0(类似于列表下标从0开始)也是-1(同列表下标倒数)。

  • level的默认值为-1,即将最内层的列转为行
  • 若dataframe中的列是单层,返回的是一个Series
  • 若dataframe有多层列,返回的是一个将指定level列转为行的dataframe

对示例数据做列转行操作

  1. 将最内层列(level=-1)转为行

    # 以下写法效果一致
    df8.stack()
    df8.stack(-1)
    df8.stack(1)

Pandas之八Reshaping(一)

  1. 将weight转为行,(level=0level=-2

    df8.stack(0)
    df8.stack(-2)

Pandas之八Reshaping(一)

  1. 将所有列都转为行,此时返回Series,同时可以看到其有多重索引

    s1=df8.stack([0,1])

Pandas之八Reshaping(一)

1.2 unstack

unstackstack的逆操作,将DataFrame或Series中指定level的index转为列。

  • level值默认为-1,即将最内层的index转为列
  • 如果index只有一层,返回的值将是一个Series
  • 若index有多层,而未全部转为列,返回的值是一个DataFrame

对上文中的结果s1执行.unstack操作

  1. 将最内层index转为列

    # 以下语句执行效果一致
    s1.unstack()
    s1.unstack(-1)
    s1.unstack(2)

    Pandas之八Reshaping(一)

  1. 将中间层index转为列

    s1.unstack(1)
    s1.unstack(-2)

Pandas之八Reshaping(一)

  1. 将多个index转为列

    s1.unstack([1,2])

Pandas之八Reshaping(一)

上一篇:Pandas之七分组统计


下一篇:说一说数据中心部署快照的那些事