一、爬取页面后电话号码加密了
二、检查页面元素发现也看不到,使用的是css字体加密
三、继续查看,发现是用base64加密的字体信息
四、网上查资料先要解密字体的对应关系
#正则查找base64加密后的数据 ba64str = re.findall('charset=utf-8;base64,(.*?)"\)', text)[0] #用base64解密 b = base64.b64decode(ba64str) print(b) #使用字体工具处理成字典 font = TTFont(BytesIO(b)) bestcmap = font['cmap'].getBestCmap() print(bestcmap)
五、查找对应关系,组成正确的对应关系字典
六、网页数据找到加密后的数据,替换成16进制