SQL 如何返回最大值所在的多条记录

2022-10-21 13:44:03

SQL 中通过 top 或 limit 子句得到第一条数据不难，再配合排序，就能得到最大的那一行：
select top 1 * from T order by f desc

如果最大值有多条记录，想全部得到，就需要子查询得到最大值，然后二次遍历数据得到和最大值相同的所有记录：
select * from T where f=(select max(f) from T)

或用窗口函数 rank() 做一下排名，然后取第 1 名：
select * from (select T.*,rank()over(partition by 1 order by age desc) f_rank from T) where f_rank=1

无论如何都要分成两步才能得到结果。试想我们去海边捡最大的贝壳，一边走一边比对就行了，始终保留最大的，同样大的就都留在手里，这很自然。但 SQL 表达能力有限，没有保留多个最大的能力，只能来回走两趟，这种绕远的解题思路如果再嵌套几层，将会给程序员带来很大的理解负担。

这种情况如果用集算器 SPL 语言就比较容易，从数据库得到原始数据：

>T=connect(”mysqlDB”).query(“select * from T”)

然后用 maxp 的 @a 选项，就能取出全部的最大值记录了：

=T.maxp@a(f)

上面这个用法是个小改善，SQL 里还有更多别扭、思维方式很绕的计算，根源在于 SQL 依赖的关系代数体系不支持有序集合计算，无法利用数据在集合中的位置，没有平衡好集合与离散数据的关系。SPL 在做有序集合计算时，对 SQL 里的 TopN 进行了变种，可以取 TopN 的值 / 记录 / 记录在集合中的位置，以应对更广泛的计算需求；可以应用到分组子集，增强分组后续操作的能力，参考《TopN 及变种》

集算器 SPL 是解决 SQL 难题的专业脚本语言，它语法简单，符合自然思维，是天然分步、层次清晰的面向过程计算语言。它采用与数据库无关的统一语法，编写的算法可在数据库间无缝迁移。它是桌面级计算工具，即装即用，配置简单，调试功能完善，可设置断点、单步执行，每步执行结果都可查看。请参阅SQL 解题手

当数据不在数据库里时，SPL 加载数据仍然方便：
=file(“d:/t.csv”).import(;,",")

SPL能很方便地嵌入到JAVA应用，可参考《Java 如何调用 SPL 脚本》。

具体使用方法可参考《如何使用集算器》。

码农公寓

相关文章