oracle+sum+之前⾏,Oracle常⽤函数--over()开窗函数
什么是分析函数(partition by):
分析函数是Oracle专门⽤于解决复杂报表统计需求的函数,它可以在数据中进⾏分组,然后计算基于组的某种统计值,并且每⼀组的每⼀⾏都可以返回⼀个统计值。
分析函数和聚合函数的不同之处是什么?
普通的聚合函数⽤group by分组,每个分组返回⼀个统计值,只有⼀⾏,⽽分析函数采⽤partition by分组,每组中包含多个值。
开窗函数 其实就是group by的另⼀种。它与group by的区别在于开窗函数可以在分组列中再排序,其实就是加了⼀列隐藏列,可以在group by中再分组的意思.
关于开窗函数(over()):
开窗函数指定了分析函数中的分组的⼤⼩。
分析函数带有⼀个开窗函数over(),包含三个分析⼦句:分组(partition by), 排序(order by), 窗⼝(rows) ,这些就是窗⼝的规则。
他们的使⽤形式如下:over(partition by xxx order by yyy rows between zzz)。
注意:窗⼝⼦句不能单独出现,必须有order by⼦句时才能出现。
两个order by的执⾏时机:
分析函数(以及与其配合的开窗函数over())是在整个sql查询结束后(sql语句中的order by的执⾏⽐较特殊)再进⾏的操作, 也就是说sql语句中的order by也会影响分析函数的执⾏结果:
a) 两者⼀致:如果sql语句中的order by满⾜与分析函数配合的开窗函数over()分析时要求的排序,即sql语句中的order by⼦句⾥的内容和开窗函数over()中的order by⼦句⾥的内容⼀样,那么sql语句中的排序将先执⾏,分析函数在分析时就不必再排序;
b) 两者不⼀致:如果sql语句中的order by不满⾜与分析函数配合的开窗函数over()分析时要求的排序,即sql语句中的order by⼦句⾥的内容和开窗函数over()中的order by⼦句⾥的内容不⼀样,那么sql语句中的排序将最后在分析函数分析结束后执⾏排序。
开窗函数的例⼦;
开窗函数指定了分析函数⼯作的数据窗⼝⼤⼩,这个数据窗⼝⼤⼩可能会随着⾏的变化⽽变化,举例如下:
1、over(order by salary) 按照salary排序进⾏累计,order by是个默认的开窗函数。
SELECTEMPLOYEE_ID,
SALARY,
MANAGER_ID,
DEPARTMENT_ID,SUM(SALARY) OVER(ORDER BYSALARY) DDFROMINFA_TEST.EMPLOYEES EMPORDER BY SALARY
功能:按salary升序排序,统计⼩于等于当前salary的salary总和。
返回结果:
ROWNUM
EMPLOYEE_ID
SALARY
MANAGER_ID
DEPARTMENT_ID
DD
备注
121
50
2100
2
128
2200
120
50
6500
2200+2200+2100 3
136
2200
122
50
6500
2200+2200+2100 4
127
2400
120
50
11300
6500+2400+2400 5
135
2400
122
50
11300
6500+2400+2400
114
30
26300
11300+2500*5 7
140
2500
123
50
26300
11300+2500*5 8
144
2500
124
50
26300
11300+2500*5 9
191
2500
122
50
26300
11300+2500*5 10
182
2500
120
50
26300
11300+2500*5
注意 SALARY为2200、2400和2500⾏的DD值,
2、over(partition by DEPARTMENT_ID)按照部门分区。
SELECTEMPLOYEE_ID,
SALARY,
MANAGER_ID,
DEPARTMENT_ID,SUM(SALARY) OVER(PARTITION BYDEPARTMENT_ID) DDFROMINFA_TEST.EMPLOYEES EMPORDER BY DEPARTMENT_ID
功能:按DEPARTMENT_ID分区,汇总各个部门的SALARY总和。
返回结果:
EMPLOYEE_ID SALARY MANAGER_ID DEPARTMENT_ID DD
200 4400 101 10 4400
201 13000 100 20 19000
202 6000 201 20 19000
114 11000 100 30 24900
115 3100 114 30 24900
116 2900 114 30 24900
119 2500 114 30 24900
118 2600 114 30 24900
117 2800 114 30 24900
注意 DEPARTMENT_ID为20,30的DD值
3、over(partition by DEPARTMENT_ID order by SALARY)按照部门分区。
SELECT
EMPLOYEE_ID, SALARY, MANAGER_ID, DEPARTMENT_ID,
SUM(SALARY) OVER (PARTITION BY DEPARTMENT_ID ORDER BY SALARY) DD
FROM INFA_TEST.EMPLOYEES EMP
ORDER BY DEPARTMENT_ID
功能:按DEPARTMENT_ID分区,按SALARY升序排序,统计各个部门内部⼩于当前SALARY的和。
返回结果:
EMPLOYEE_ID SALARY MANAGER_ID DEPARTMENT_ID DD
200 4400 101 10 4400
201 13000 100 20 6000
202 6000 201 20 19000
114 11000 100 30 2500
115 3100 114 30 5100
116 2900 114 30 7900
119 2500 114 30 10800
118 2600 114 30 13900
117 2800 114 30 24900
注意 DEPARTMENT_ID为20、30的DD值和2中的区别
4、over(order by salary range between 50 preceding and 150 following)
SQL> lect
empno,sal,mgr,deptno,
sum(sal) over (partition by deptno order by sal
RANGE BETWEEN 0 PRECEDING AND 100 FOLLOWING) dd
from emp;
功能:按DEPARTMENT_ID分区,按SALARY升序排序,汇总当前SALARY到⽐当前SALARY⼤100之间的SALARY总和。
返回结果:
EMPNO SAL MGR DEPTNO DD
----- ------ ------ ------- --------
7934 1300 7782 10 1300
7782 2450 7839 10 2450
7839 5000 10 5000
7369 800 7902 20 800
7566 2975 7839 20 5975 3000在2975和(2975+100)之间,故求2975与3000的和
7902 3000 7566 20 3000
7900 950 7698 30 950
7521 1250 7698 30 2500
7654 1250 7698 30 2500
7844 1500 7698 30 3100
7499 1600 7698 30 1600
7698 2850 7839 30 2850
已选择12⾏。
解释:返回前置⾏和当前⾏SALARY相等,后续⾏⽐他⼤100的记录,在SALARY列上求和。
上下边界没有限制:OVER (PARTITION BY DEPARTMENT_ID ORDER BY SALARY RANGE BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING)
SQL> lect empno,sal,mgr,deptno,
sum(sal) over (partition by deptno order by sal