用Python爬了我的微信好友,他们是这样的...

数据分析

分析微信好友数据的前提是获得好友信息,通过使用 itchat 这个模块,这一切会变得非常简单,我们通过下面两行代码就可以实现:

itchat.auto_login(hotReload = True) 
friends = itchat.get_friends(update = True)

同平时登录网页版微信一样,我们使用手机扫描二维码就可以登录,这里返回的friends对象是一个集合,第一个元素是当前用户。所以,在下面的数据分析流程中,我们始终取friends[1:]作为原始输入数据,集合中的每一个元素都是一个字典结构,以我本人为例,可以注意到这里有Sex、City、Province、HeadImgUrl、Signature这四个字段,我们下面的分析就从这四个字段入手:

在这里插入图片描述

好友性别

分析好友性别,我们首先要获得所有好友的性别信息,这里我们将每一个好友信息的Sex字段提取出来,然后分别统计出Male、Female和Unkonw的数目,我们将这三个数值组装到一个列表中,即可使用matplotlib模块绘制出饼图来,其代码实现如下:

def analyseSex(firends): 
  sexs = list(map(lambda x:x['Sex'],friends[1:])) 
 counts = list(map(lambda x:x[1],Counter(sexs).items())) 
 labels = ['Unknow','Male','Female'] 
 colors = ['red','yellowgreen','lightskyblue'] 
 plt.figure(figsize=(8,5), dpi=80) 
 plt.axes(aspect=1) 
 plt.pie(counts, #性别统计结果 
   labels=labels, #性别展示标签 
   colors=colors, #饼图区域配色 
   labeldistance = 1.1, #标签距离圆点距离 
   autopct = '%3.1f%%', #饼图区域文本格式 
   shadow = False, #饼图是否显示阴影 
   startangle = 90, #饼图起始角度 
   pctdistance = 0.6 #饼图区域文本距离圆点距离 
 ) 
 plt.legend(loc='upper right',) 
 plt.title(u'%s的微信好友性别组成' % friends[0]['NickName']) 
 plt.show()

这里简单解释下这段代码,微信中性别字段的取值有Unkonw、Male和Female三种,其对应的数值分别为0、1、2。通过Collection模块中的Counter()对这三种不同的取值进行统计,其items()方法返回的是一个元组的集合。

该元组的第一维元素表示键,即0、1、2,该元组的第二维元素表示数目,且该元组的集合是排序过的,即其键按照0、1、2 的顺序排列,所以通过map()方法就可以得到这三种不同取值的数目,我们将其传递给matplotlib绘制即可,这三种不同取值各自所占的百分比由matplotlib计算得出。下图是matplotlib绘制的好友性别分布图:

在这里插入图片描述

好友头像

分析好友头像,从两个方面来分析,第一,在这些好友头像中,使用人脸头像的好友比重有多大;第二,从这些好友头像中,可以提取出哪些有价值的关键字。

这里需要根据HeadImgUrl字段下载头像到本地,然后通过腾讯优图提供的人脸识别相关的API接口,检测头像图片中是否存在人脸以及提取图片中的标签。其中,前者是分类汇总,我们使用饼图来呈现结果;后者是对文本进行分析,我们使用词云来呈现结果。关键代码如下所示:

def analyseHeadImage(frineds): 
 # Init Path 
 basePath = os.path.abspath('.') 
 baseFolder = basePath + '\\HeadImages\\'
 if(os.path.exists(baseFolder) == False): 
  os.makedirs(b
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值