sqldistinct详解以及优化
炒菜花⼀.distinct简介
distinct这个关键字来过滤掉多余的重复记录只保留⼀条,但往往只⽤它来返回不重复记录的条数,⽽不是⽤它来返回不重记录的所有值。其原因是distinct只有⽤⼆重循环查询来解决,⽽这样对于⼀个数据量⾮常⼤的站来说,⽆疑是会直接影响到效率的。
下⾯先来看看例⼦:
table表
字段1 字段2
青蛙蹦蹦跳id name
1 a
破天荒是什么意思2 b
3 c
4 c
5 b
库结构⼤概这样,这只是⼀个简单的例⼦,实际情况会复杂得多。
⽐如我想⽤⼀条语句查询得到name不重复的所有数据,那就必须使⽤distinct去掉多余的重复记录。
lect distinct name from table
得到的结果是:
----------
name
a
b
c
好像达到效果了,可是,我想要得到的是id值呢?改⼀下查询语句吧:
lect distinct name, id from table
结果会是:
----------
id name
1 a
2 b
3 c
4 c
5 b
distinct怎么没起作⽤?作⽤是起了的,不过他同时作⽤了两个字段,也就是必须得id与name都相同的才会被排除。。。。。。。炒南瓜的做法
我们再改改查询语句:退休工资计算方法
lect id, distinct name from table
很遗憾,除了错误信息你什么也得不到,distinct必须放在开头。难到不能把distinct放到where条件⾥?能,照样报错。
下⾯⽅法可⾏:
lect *, count(distinct name) from table group by name
结果:
id name count(distinct name)
1 a 1
鸭子炖萝卜2 b 1
3 c 1
最后⼀项是多余的,不⽤管就⾏了,⽬的达到。。。。。
group by 必须放在 order by 和 limit之前,不然会报错
==============以上是关于的distinct的⼀种⽤法==============
⽤distinct关键字只能过滤查询字段中所有记录相同的(记录集相同),⽽如果要指定⼀个字段却没有效果,另外distinct关键字会排序,效率很低。
lect distinct name from t1 能消除重复记录,但只能取⼀个字段,现在要同时取id,name这2个字段的值。
lect distinct id,name from t1 可以取多个字段,但只能消除这2个字段值全部相同的记录
所以⽤distinct达不到想要的效果,⽤group by 可以解决这个问题。
⼆. distinct使⽤
1 Distinct 位置
单独的distinct只能放在开头,否则报错,语法错误
mysql> Select player_id,distinct(task_id) from task;
ERROR 1064 (42000): You havean error in your SQL syntax; check the manual that
corresponds to your MySQLrver version for the right syntax to u near 'disti
nct(task_id) from task' atline 1
现在把distinct放在开头
mysql> Select distinct(task_id),taskid from task;
查询成功
与其他函数使⽤时候,没有位置限制如下
Select player_id,count(distinct(task_id))from task;
这种情况下是正确的,可以使⽤。
2 Distinct⽤法写诗的方法
a.在count计算不重复的记录的时候能⽤到
⽐如SELECT COUNT( DISTINCT player_id ) FROM task;
就是计算talbebname表中id不同的记录有多少条
b,在需要返回记录不同的id的具体值的时候可以⽤
⽐如SELECT DISTINCT player_id FROM task;
返回talbebname表中不同的id的具体的值
c.上⾯的情况2对于需要返回mysql表中2列以上的结果时会有歧义
⽐如SELECT DISTINCT player_id, task_id FROM task;
实际上返回的是player_id与task_id同时不相同的结果,也就是DISTINCT同时作⽤了两个字段,必须得player_id与task_id都相同的才被排除了,与我们期望的结果不⼀样,我们期望的是player_id不同被过滤
在这种情况下,distinct同时作⽤了两个字段,player_id,task_id
稻草人读书笔记
d.这时候可以考虑使⽤group_concat函数来进⾏排除,不过这个mysql函数是在mysql4.1以上才⽀持的
e. 其实还有另外⼀种解决⽅式,就是使⽤
SELECT player_id, task_id, count(DISTINCT player_id) FROM task.
虽然这样的返回结果多了⼀列⽆⽤的count数据(有时也许就需要这个数据)
f 同时我们还可以利⽤下⾯的⽅式解决b遇到的歧义问题通过group by 分组
lect player_id,task_id from task group by player_id