不带时间窗口的的groupby 会来一条数据进行一条数据的更新操作。这个时候结果是incrment的状态,每次都是覆盖(包含)了上次的结果。
带时间窗口的groupby 会对时间窗口内的一批数据进行处理。这个结果是segment的状态,与窗口个数对应。
上面第二个图的意思是
根据时间间隔把数据隔开成好几份,
然后每份内部再按照user进行聚合(统计上化简)
2024-03-03 18:47:40
不带时间窗口的的groupby 会来一条数据进行一条数据的更新操作。这个时候结果是incrment的状态,每次都是覆盖(包含)了上次的结果。
带时间窗口的groupby 会对时间窗口内的一批数据进行处理。这个结果是segment的状态,与窗口个数对应。
上面第二个图的意思是
根据时间间隔把数据隔开成好几份,
然后每份内部再按照user进行聚合(统计上化简)