我用爬虫遇到一个网站,爬到的网页代码如下:
爬的中文全是\uxxxx
格式的,使用下面一行代码就可以解决:
get = requests.get(url, proxies=ip, headers=headers)
html = get.text.encode('utf-8').decode("unicode-escape")
使用unicode-escape
进行反编码后得到其对应的汉字。
我用爬虫遇到一个网站,爬到的网页代码如下:
爬的中文全是\uxxxx
格式的,使用下面一行代码就可以解决:
get = requests.get(url, proxies=ip, headers=headers)
html = get.text.encode('utf-8').decode("unicode-escape")
使用unicode-escape
进行反编码后得到其对应的汉字。