ip作为识别和定位用户的手段来说,对互联网企业起着至关重要的作用,特别是在精准营销、反欺诈等业务方面。本文描述如何简单的去构建自己的ip地址库。
ip作为识别和定位用户的手段来说,对互联网企业起着至关重要的作用,特别是在精准营销、反欺诈等业务方面。本文描述如何简单的去构建自己的ip地址库。
拿来主义
实际上,对大部分用户来说,如果要求不高,完全可以拿现成的资源来使用:
- 老外的数据有maxmind,不过对国内有些水土不服
- BAT级别的公司有开放api支持,但不提供离线库
- 国内也有第三方的优秀提供商,比如ipip.net。他们提供免费的离线库,以及收费的服务。是国内比较专业的ip信息服务商,也有一篇高质量的ip库构建文章讲述了来龙去脉。普通使用,推荐直接使用该库
吃饱了撑着
但对我们这样的风控公司来说,现成的资源有以下不足:
1.需要离线的数据库。我们的产品是提供私有化的大数据风控平台,由于涉及的信息比较敏感,需要隔绝外网来保证数据隐私性和安全性,api的方式不合适
2.需要定期更新的数据库。ip地址经常变化,需要精准度高、更新频繁的来源,评测下来,现存的第三方提供商还是存在数据覆盖率和准确性方面的不足
3.需要规范化的数据。我们需要手机、身份证、ip等多个维度的归属地,但数据来源多样,比如:在很多场合,这种数据不一致没关系,但我们的风控引擎会拿来作比较计算,这种不一致会导致大量的计算偏差,引起误报
- 有的显示“南京”, 有的显示“南京市”
- 有的显示县级市,有的显示地级市
- 有些城市改过名称,有的显示老名称,有的显示新名称