数据库查询结果去重常⽤⽅法整理
⼀般情况下,数据库去重复有以下那么三种⽅法:
第⼀种:
两条记录或者多条记录的每⼀个字段值完全相同,这种情况去重复最简单,⽤关键字distinct就可以去掉。例:
SELECT DISTINCT * FROM TABLE
使⽤ distinct:
使⽤distinct去重,只能去掉重复记录,有些场景也并不是很适⽤,分场景⽽异
第⼆种:
两条记录之间之后只有部分字段的值是有重复的,但是表存在主键或者唯⼀性ID。如果是这种情况的话⽤DISTINCT是过滤不了的,这就要⽤到主键id的唯⼀性特点及group by分组。例:
SELECT * FROM TABLE
WHERE ID
IN
(SELECT MAX(ID) FROM TABLE GROUP BY [去除重复的字段名列表,....])
第三种:
两条记录之间之后只有部分字段的值是有重复的,但是表不存在主键或者唯⼀性ID。这种情况可以使⽤临时表,讲数据复制到临时表并添加⼀个⾃增长的ID,在删除重复数据之后再删除临时表。例:
//创建临时表,并将数据写⼊到临时表
SELECT IDENTITY(INT1,1) AS ID,* INTO NEWTABLE(临时表) FROM TABLE
//查询不重复的数据
SELECT * FROM NEWTABLE WHERE ID IN (SELECT MAX(ID) FROM NEWTABLE GROUP BY [去除重复的字段名列表,....])
//删除临时表
DROP TABLE NEWTABLE
⼏个简单的⼩案例分享⼀下:
案例1:
需求:去重重复数据,值保留⼀条数据(重复数据完全相同,表并未设置主键)
第⼀步:先找出表中重复的数据:
SELECT
CODE,
NAME,
PCODE,
count(*) AS count
FROM
lp_area_code_new_bak
GROUP BY
`CODE`
HAVING
count > 1
重复数据共12条:
第⼆步:查出不重复的数据:
数据⼀共:
去掉重复数据12条:3844-12=3832条
建个临时表,然后数据覆盖就解决问题了!
(有时脑袋就是转不过弯来,拍⼀下就出来了 哈哈)
案例2:
需求分析
数据库中存在重复记录,删除保留其中⼀条(是否重复判断基准为多个字段)⼤概也分为3步来理解:
第⼀步:
查询出重复记录形成⼀个集合(临时表t2),集合⾥是每种重复记录的最⼩ID
(
跨年语录
SELECT
min(id) id,
ur_id,
monetary,
consume_time
FROM
consum_record表演形式
GROUP BY
ur_id,
monetary,
consume_time
HAVING
count(*) > 1
) t2
第⼆步:
关联 判断重复基准的字段
consum_record.ur_id = t2.ur_id
AND ary = t2.monetary
AND sume_time = t2.consume_time
狼的复数第三步:
根据条件,删除原表中id⼤于t2中id的记录
最后SQL合并⼀下为:
DELETE consum_record
FROM
consum_record,
(
SELECT
min(id) id,
ur_id,
怎样去除水垢monetary,
consume_time经验的近义词
FROM
consum_record
GROUP BY
ur_id,
monetary,
consume_time
HAVING
count(*) > 1
偶像英语
) t2
WHERE
consum_record.ur_id = t2.ur_id
格林童话有哪些
and ary = t2.monetary
and sume_time = t2.consume_time
小莲的故事
AND consum_record.id > t2.id;