Flink的Group by window图示(转载)

不带时间窗口的的groupby 会来一条数据进行一条数据的更新操作。这个时候结果是incrment的状态,每次都是覆盖(包含)了上次的结果。

Flink的Group by window图示(转载)

 

 

带时间窗口的groupby 会对时间窗口内的一批数据进行处理。这个结果是segment的状态,与窗口个数对应。

Flink的Group by window图示(转载)

上面第二个图的意思是

根据时间间隔把数据隔开成好几份,

然后每份内部再按照user进行聚合(统计上化简)

上一篇:Pandas基础|列方向分组变形


下一篇:跟小白学Python数据分析——分组分析