SQL 中通过 top 或 limit 子句得到第一条数据不难,再配合排序,就能得到最大的那一行:
select top 1 * from T order by f desc
如果最大值有多条记录,想全部得到,就需要子查询得到最大值,然后二次遍历数据得到和最大值相同的所有记录:
select * from T where f=(select max(f) from T)
或用窗口函数 rank() 做一下排名,然后取第 1 名:
select * from (select T.*,rank()over(partition by 1 order by age desc) f_rank from T) where f_rank=1
无论如何都要分成两步才能得到结果。试想我们去海边捡最大的贝壳,一边走一边比对就行了,始终保留最大的,同样大的就都留在手里,这很自然。但 SQL 表达能力有限,没有保留多个最大的能力,只能来回走两趟,这种绕远的解题思路如果再嵌套几层,将会给程序员带来很大的理解负担。
这种情况如果用集算器 SPL 语言就比较容易,从数据库得到原始数据:
>T=connect(”mysqlDB”).query(“select * from T”)
然后用 maxp 的 @a 选项,就能取出全部的最大值记录了:
=T.maxp@a(f)
上面这个用法是个小改善,SQL 里还有更多别扭、思维方式很绕的计算,根源在于 SQL 依赖的关系代数体系不支持有序集合计算,无法利用数据在集合中的位置,没有平衡好集合与离散数据的关系。SPL 在做有序集合计算时,对 SQL 里的 TopN 进行了变种,可以取 TopN 的值 / 记录 / 记录在集合中的位置,以应对更广泛的计算需求;可以应用到分组子集,增强分组后续操作的能力,参考《TopN 及变种》
集算器 SPL 是解决 SQL 难题的专业脚本语言,它语法简单,符合自然思维,是天然分步、层次清晰的面向过程计算语言。它采用与数据库无关的统一语法,编写的算法可在数据库间无缝迁移。它是桌面级计算工具,即装即用,配置简单,调试功能完善,可设置断点、单步执行,每步执行结果都可查看。请参阅SQL 解题手
当数据不在数据库里时,SPL 加载数据仍然方便:
=file(“d:/t.csv”).import(;,",")
SPL能很方便地嵌入到JAVA应用,可参考《Java 如何调用 SPL 脚本》。
具体使用方法可参考 《如何使用集算器》。