处理数据库中的重复数据,只保存一条有效数据:
1.新增自增列id
alter table 表名 add _ID int identity (1,1);
PostgresSQL:alter table 表名 ADD id serial ;
PostgreSQL使用序列来标识分区的自增长,数据类型有smallserial,serial和bigserial。这些属性数据库MySQL数据库支持的AUTO_INCREMENT属性。

2.删除数据
delete from 表名
where id not in (
select t.min_id from
(select min(id) as min_id
from shw.user_info
group by sfzhm,xm) as t);
思路:
1)根据sfzhm和xm进行分组;
2)取出分组后的最大id(或最小id);
3)删除除最大(或最小)id以外的其他字段;
not in 执行效率比较低,可以换成not exists,并且给表的id列建索引
本文介绍了一种通过新增自增ID并删除重复数据的方法,确保数据库中仅保留唯一记录。具体步骤包括:1) 新增自增列以标识每条记录;2) 依据特定字段分组,筛选出最小或最大ID;3) 删除除选定ID外的所有重复项。
635

被折叠的 条评论
为什么被折叠?



