一句话实现MySQL库中的按条件变化分组

2022-09-23 20:38:16

这种分组的依据是比较上一行字段值，发生某种变化时（如变大超过 10）产生新组。SQL 仅支持等值分组，要想实现这种有序条件分组就得经过几次数据变换，变换成等值分组。以支持窗口函数的新版 MySQL 为例，大概经过这么三步：

1、得出变化标志字段 flag。通过窗口函数 lag 得到上一行的字段值，满足变化条件（如本行 - 上一行 >10）flag 设为 1，否则为 0；

2、累加 flag 字段得到 acc 字段。从第一行累加到当前行，还是得用窗口函数实现：sum(flag)…BETWEEN ROWS UNBOUNDED AND CURRENT ROW；

3、按 acc 字段进行常规等值分组即可。

早期没有窗口函数的 MySQL，理论上也能实现，更复杂，就不细说了。

这类有序分组如果用 SPL 语言就很简单，用 group 操作的 @i 选项，一句就搞定了：

=connect(”mysqlDB”).query(“select * from t”).group@i(f>~[-1].f+10)

完成分组动作后，得到两层结构的序表 B。后续针对第二层分组子集，做任意计算也都容易一句搞定：

=B.max(~.len()) 得到最大组的行数；

=B.(~.new(f,avg(f2))).conj() 得到每组 f2 的平均值；

=B.(~.sort@z(f2).m(to(3))).conj() 取出每组 f2 最大的三行；

除了有序条件分组，还有有序等值分组，嵌套分组等多种 SQL 难实现的分组方式，详情参考《分组子集》。

当数据不在数据库里时，SPL 执行复杂计算仍然方便：
=file(“d:/t.csv”).import(;,",").group...

SPL能很方便地嵌入到JAVA应用，可参考《Java 如何调用 SPL 脚本》。

具体使用方法可参考《如何使用集算器》。

码农公寓