删除数据库中的重复记录(仅删除重复的)
背景:今天在用crawler爬数据的时候,第一次爬的时候被我意外中止了,后来又重新开始,但却忘了清除一些垃圾数据,导致在wordlocation 表中产生了不少重复的记录。wordlocation 表的定义如下 wordlocation(urlid, wordid, location),其中(urlid, wordid) 应该是唯一的。要求:从wordlocation 表中删除多余的重复数据方案:
原创
2013-08-01 00:55:42 ·
781 阅读 ·
0 评论