1、很多的爬虫请求头就是默认的一些很明显的爬虫头python-requests/2.18.4,诸如此类,当运维人员发现携带有这类headers的数据包,直接拒绝访问,返回403错误*
解决办法:加UA
2、封IP
解决办法:IP代理池
3、*** 自定义字体***
解决办法:1.看能否在别的地方获取同样的值。
2.找到对应的字体文件,通过python解析出对应的xml数据,然后对应分析得出每个字体对应的值
1、很多的爬虫请求头就是默认的一些很明显的爬虫头python-requests/2.18.4,诸如此类,当运维人员发现携带有这类headers的数据包,直接拒绝访问,返回403错误*
解决办法:加UA
2、封IP
解决办法:IP代理池
3、*** 自定义字体***
解决办法:1.看能否在别的地方获取同样的值。
2.找到对应的字体文件,通过python解析出对应的xml数据,然后对应分析得出每个字体对应的值