我们在看武侠小说时,总有些高手能飞天遁地,似乎无所不能,然而我们也总能发现那些如影随形的人,他们不分日月,不分四季的追踪。当今社会,也有这样的情况,追逐的战场已经变成了虚拟复杂的网络世界,根据自己的知识浅谈利用网络和数据经行“人肉”和定位。
我们想要精确定位一个人,通过人的逻辑,我们有这个办法以及它的实现。思路:通过各个社交平台上“晒”出的信息经行定位。实现技术:爬虫,数据库。首先我们分析思路,这个思路建立在人的逻辑之上,我们一般如何确定不同社交平台的账号属于一个人?最简单的一个逻辑(思路),他的一个社交平台上泄露了另一个社交平台的信息,这种信息的泄露有明显的和潜在的。明显的,最简单的思路,他在某个社交平台公布了另一个社交平台的信息,比如,他在贴吧某个帖子留下的自己的qq。那么我们清楚的明确了两个账号属于一个人。那么潜在的呢,也很好举例,很多人不同平台上,用同样的头像和昵称来保持一致性,方便他的朋友明确,当一个由偏僻小众的字符(字符包括文字等)组成的昵称同时出现在不同平台,那么我们就有很大把握确定多个账号属于一个人(为什么能确定可以利用数理统计的方法,这里暂且不表)。这是比较浅的潜在一致性。深层次的,比如某些曝料人曝光xx和xx在一起了,通过的是什么?社交平台显示的位置。比如一个人在微博显示自己正在A市B公园,然后他稍后又在贴吧发帖,自己在A市C宾馆,而B宾馆在B公园旁边,之后的信息又显示两个账号在同一天表达了离开A市的信息,那么我们亦有一定把握确定他们是一个人。
好了,思路已经解析完毕,现在我们聊聊如何通过计算机实现。我这学期重修的C程序和大一下的面向对象编程都是同一位老师,虽然他的编码能力似乎不强,但是我觉得他对计算机利用的方式有极其深刻的理解。他说过一句话:“计算机擅长重复“。用我自己的思考我加上一句话,人擅长变,计算机擅长不变。这句话是接下来实现的核心,也就是为什么会用到计算机的部分原因。人想要不停寻找一个账号的所有者,或者将他们定位到一个人,自己投入到海量的数据中显然是不可能的,除非一你对他有很深的兴