关于avg


------------前文转自secooler 快乐的DBA---------------------------

原文地址http://blog.itpub.net/519536/viewspace-624799/
--------------------------------------------------------------
我们通过这个文章来看一下AVG函数的普通用法和分析函数用法的区别。都是得到平均数,但是作用的范围是不一样的。
【Analytic】分析函数之MIN函数:http://space.itpub.net/519536/viewspace-624736
【Analytic】分析函数之MAX函数:http://space.itpub.net/519536/viewspace-624749

1.万变不离其宗,先看AVG函数的语法描述。
http://download.oracle.com/docs/cd/B19306_01/server.102/b14200/functions011.htm#SQLRF00609
AVG([ DISTINCT | ALL ] expr)
  [ OVER(analytic_clause) ]

2.通过实验看一下两种AVG函数的用法和区别
1)创建测试表T,并初始化几条数据。
sec@ora10g> create table t (group_id number(10), name varchar2(10), salary int);
sec@ora10g> insert into t values (1,'Tom',1200);
sec@ora10g> insert into t values (2,'Kary',2400);
sec@ora10g> insert into t values (2,'Joe',800);
sec@ora10g> insert into t values (3,'Erick',3600);
sec@ora10g> insert into t values (3,'Andy',600);
sec@ora10g> insert into t values (3,'Mary',300);
sec@ora10g> commit;

2)T表全貌
sec@ora10g> select * from t;

  GROUP_ID NAME                               SALARY
---------- ------------------------------ ----------
         1 Tom                                  1200
         2 Kary                                 2400
         2 Joe                                   800
         3 Erick                                3600
         3 Andy                                  600
         3 Mary                                  300

6 rows selected.

共三组数据,group_id分别是1、2和3。第1组有一个人,第2组有两个人,第3组有三个人。最后一列是每个人的薪水值。

3)先看一下普通AVG函数的用法
sec@ora10g> select group_id, name, salary, avg(salary) from t group by group_id, name, salary order by group_id;

  GROUP_ID NAME                               SALARY AVG(SALARY)
---------- ------------------------------ ---------- -----------
         1 Tom                                  1200        1200
         2 Joe                                   800         800
         2 Kary                                 2400        2400
         3 Andy                                  600         600
         3 Erick                                3600        3600
         3 Mary                                  300         300

6 rows selected.

得到的最大值是按照“group_id, name, salary”三列进行分组后的每组最大值。

4)再看一下分析函数AVG得到的平均值
sec@ora10g> select group_id, name, salary, avg(salary) over (partition by group_id) analytic_avg from t order by group_id;

  GROUP_ID NAME                               SALARY ANALYTIC_AVG
---------- ------------------------------ ---------- ------------
         1 Tom                                  1200         1200
         2 Kary                                 2400         1600
         2 Joe                                   800         1600
         3 Erick                                3600         1500
         3 Andy                                  600         1500
         3 Mary                                  300         1500

6 rows selected.

注意这里得到的平均值与基本AVG函数得到的平均值区别,这里的平均值是每行记录所对应组内的平均薪酬值。

5)我们进一步限定一下计算的范围
sec@ora10g> select group_id, name, salary, avg(salary) over (partition by group_id order by name rows between 1 preceding and 1 following) analytic_avg from t order by group_id;

  GROUP_ID NAME                               SALARY ANALYTIC_AVG
---------- ------------------------------ ---------- ------------
         1 Tom                                  1200         1200
         2 Joe                                   800         1600
         2 Kary                                 2400         1600
         3 Andy                                  600         2100
         3 Erick                                3600         1500
         3 Mary                                  300         1950

6 rows selected.

此时得到的薪酬值是每行记录与其之前的记录和其之后的记录三者的平均值。
注意头和尾的平均值计算方法。
头:组内第一条记录与第二条记录的和除以二得到第一条记录的平均值;
尾:组内最后一条记录与倒数第二条记录的和除以二得到最后一条记录的平均值。

3.小结
具体问题具体分析,在统计分析报表系统中AVG分析函数用处颇大。
有关分析函数的扩展可以参考Oracle的官方文档中的“Analytic Functions”描述:http://download.oracle.com/docs/cd/B19306_01/server.102/b14200/functions001.htm#SQLRF06174

Good luck.

secooler
10.01.10

-- The End --

------------------------------------华丽的分割线--------------------------------------

补充:
1.avg(salary) over (partition by group_id order by name rows between 1 preceding and 1 following
  红色部分不写代表从第一行到当前行为止~
2.如果向前没有行了,或者向后没有行了,那就不计算了~(1950=(3600+300)x2)
3.Null不会被当做一个value来计算
4.还有CURRENT ROW这种值( between  CURRENT ROW  and 3 following,当前行+接下来的三行)

上一篇:MySQL-官方文档摘抄


下一篇:Caused by: java.sql.SQLException: 违反协议 error code [17401]