重复记录只取其一

重复记录只取其一

左直拳

有时侯会遇到需要过滤重复记录的情况。

所谓的重复记录,不一定就是完全相同的记录,而更多是指一部分字段内容相同的记录。

比如说,有一个表记录访问日志(LOG),结构如下:

字段

类型

含义

ID

INT

PageId

INT

访问页面的ID

IP

字符串

访问者的IP地址

Date

字符串

访问者日期,如“<chsdate w:st="on" isrocdate="False" islunardate="False" day="1" month="7" year="2007"><span lang="EN-US" style="FONT-SIZE: 12pt"><font face="Times New Roman">2007-07-01</font></span></chsdate>”

要求统计页面的访问IP数量,相同的IP,日期相同,算一个IP;日期不同,就算不同的IP

无论是用group by date,ip 还是 group by ip,date,都不正确。

最后是这样写:

SELECT COUNT1AS IpNum FROM LOG AS a

WHERE NOT EXISTS(

SELECT 1 FROM LOG WHERE IP=a.IP AND Date=a.Date AND Id<a.Id

)

关键之处在于 Id<a.Id,就是说IP相同、日期相同的记录中,我只拿第一条,就是ID最小的那一条。

有三千人溺水,我只挑其中一个来嫖。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值