需要处理的表大概包含400万条数据,首次运行php代码之后发现完全重复的数据有很多,原因可能是导入时重复导入某张表(当时一起导入超过30份数据到同一个表可能出错),也有可能拿到的数据中存在重复数据,因此我萌生了删除掉重复数据只剩一个的想法。
在网上没有找到太多的资料,因为我想要删除的是表中内容完全一致的条目而且具有多个主键,而网上只有这里找到了一个删除除了自动编号不同,其他都相同的学生冗余信息的方法,于是我想到可以给我的表中数据前加入一个单一的id用于区分,然后可以使用上述方法。这里记录了设置自增型id的方法。设置之后的效果如下: