SQL反模式学习笔记15 分组

2014-10-14 15:49:19 

目标:查询得到每组的max(或者min等其他聚合函数)值,并且得到这个行的其他字段

 

反模式:引用非分组列

  单值规则:跟在Select之后的选择列表中的每一列,对于每个分组来说都必须返回且仅返回一直值。

          select ProductId,Max(DateReported) as Latest

          from Bugs  as b

          Join BugProducts  as bp

               on b.BugId = bp.BugId

         Group by ProductId;

 

  在Group By字句中出现的列能够保证他们在每一组都只有一个值,无论这个组匹配多少行;

     Max()等表达式也能保证每组都返回单一的值,即传回参数中的最大值。

 

如何识别反模式:当输入一个违背了单值规则的查询时,会立刻返回给你一个错误。数据库会返回不同的错误信息。

  在SQLite和MySQL中,有歧义的列可能包含不可预测的和不可靠的数据。

 

合理使用反模式

  没有歧义的关系叫做“功能依赖”,最常见的就是表的主键和对应的值。

 

解决方案:使用无歧义的列

  1、只查询功能依赖的列:将有歧义的列排除在查询之外。

  2、使用关联子查询:关联子查询会引用外连接查询,并且根据外联结果查询中的每一条记录最终返回不同的结果。

          关联子查询的性能不是最好的,因为外联结查询结果中的每一条记录都会执行一遍关联的子查询。

  3、使用衍生表:使用衍生表来执行子查询,先得到一个临时的结果,然后用这个临时表和原表进行连接查询。

          性能相比子查询更好一些。但是数据库必须将临时表得到的记录存在一张临时表中,因此这个方案也不是最好的。

  4、使用Join:创建一个联结查询区匹配哪些可能不存在的记录。这样的查询结果被称为外连接查询。

           该方案使用与针对大量数据查询并且可伸缩性比较关键时。能更好的适应数据量的变化,但是难以理解与维护。

  5、对额外的列使用聚合函数。

  6、链接同组所有值:MySQL与SQLite提供了一个叫做Group_Contract()函数,能将这一组中的所有的值连在一起作为单一值返回,

          多个值之间用逗号分隔。其他数据库不支持该函数。

 

结论:遵循单值规则,避免获得模棱两可的查询结果。

SQL反模式学习笔记15 分组

上一篇:【转】SQL修改字段长度


下一篇:SQL反模式学习笔记14 关于Null值的使用