避孕药什么时候吃Postgresql去重函数distinct的⽤法说明
在项⽬中我们常会对数据进⾏去重处理,有时候会⽤in或者EXISTS函数。或者通过group by也是可以实现查重
不过Postgresql还有⾃带去重函数:distinct
下⾯是distinct 的实例:
1、创建表:ur
CREATE TABLE `ur` (
`name` varchar(30) DEFAULT NULL,
`age` int(11) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
INSERT INTO `ur` VALUES ('张三', 20);
INSERT INTO `ur` VALUES ('李四', 22);
INSERT INTO `ur` VALUES ('李四', 20);
INSERT INTO `ur` VALUES ('张三', 22);
INSERT INTO `ur` VALUES ('张三', 20);
查询结果:
SELECT * FROM ur
张三 20
李四 22
李四 20
张三 22大学生就业报告
张三 20
2、根据 name 查询去重后的数据:
SELECT distinct name FROM ur
张三
李四
3、根据name 和 age 查询去重后的数据:
SELECT distinct name,age FROM ur
张三 20
李四 22
李四 20
张三 22
4、根据name,age查询重复数据数:
SELECT distinct name,age,count(*) 数据条数 FROM ur GROUP BY name,age
张三 20 2
张三 22 1
李四 20 1
李四 22 1
⼆、查出重复数据后,我们需要删除重复数据
删除重复数据⼀般⼏种⽅式,⼀般采⽤临时表或者根据某个字段,例如id等,通过max或者min函数去重。
补充:基于postgresql ctid实现数据的差异同步
项⽬背景:
最近在做异构数据同步⽅⾯(⾮实时)的⼯作,从oracle,gba,postgresql向mysql数据库中同步,对于没有⾃增字段(⾃增ID或时间字段)的业务表,做差异同步是⼀件⾮常⿇烦的事情,主要体现在记录的新增、更新与删除上
备注:源库只提供⼀个只读权限的⽤户
ctid在pg中的作⽤
ctid是⽤来指向⾃⾝或新元组的元组标识符,怎么理解呢?下⾯能过⼏个实验来测试⼀下
satdb=# create table test_ctid(id int,name varchar(100));
satdb=# inrt into test_ctid values(1,‘a'),(1,‘a');
satdb=# inrt into test_ctid values(2,‘a'),(3,‘a');
查看记录的ctid值
satdb=# lect id,name,ctid from test_ctid;
id | name | ctid
----±-----±------
1 | a | (0,1)
1 | a | (0,2)
2 | a | (0,3)
3 | a | (0,4)
(4 rows)
对id为2的记录进⾏更新
satdb=# update test_ctid t name=‘b' where id=2;
UPDATE 1
这⾥可以看到id=2的记录指向了新的元组标识符 (0,5)购房流程
satdb=# lect id,name,ctid from test_ctid;
id | name | ctid
----±-----±------
1 | a | (0,1)
1 | a | (0,2)
3 | a | (0,4)
2 | b | (0,5)
(4 rows)
狼人杀角色介绍satdb=# lect * from test_ctid where ctid='(0,1)';
id | name
----±-----
1 | a
(1 row)
删除 id=3的记录后,对应的ctid(0,4)不存在了
satdb=# delete from test_ctid where id=3;
DELETE 1
satdb=# lect *,ctid from test_ctid;
id | name | ctid
----±-----±------
1 | a | (0,1)
1 | a | (0,2)
2 | b | (0,5)
(3 rows)
再插⼊⼀条记录时,看看会不会使⽤(0,4)这个标识符
好预算
satdb=# inrt into test_ctid values(3,‘d');
可爱老虎
英文生日祝福
INSERT 0 1
satdb=# lect *,ctid from test_ctid;
id | name | ctid
吃什么食物补肾----±-----±------
1 | a | (0,1)
1 | a | (0,2)
2 | b | (0,5)
3 | d | (0,6)
这⾥新插⼊的记录不会使⽤(0,4),⽽是直接分配新的标识符(0,6)
总结:
1、ctid的作⽤与oracle rowid类似,可以唯⼀标识⼀条记录
2、记录的更新后,后⽣产新的ctid
3、记录删除后,新插⼊的记录不会使⽤已经删除记录的ctid
4、基于ctid可以实现记录的去重操作
5、基于ctid可以实现差异增量同步(新增、删除、更新)
以上为个⼈经验,希望能给⼤家⼀个参考,也希望⼤家多多⽀持。如有错误或未考虑完全的地⽅,望不吝赐教。