在爬取京东的某一个ajax时遇见了类似这样的字符串
“濂ュ厠鏂┖璋冧紒涓氫細鍛樻洿浼樻儬”
用以下代码成功解决,一直都弄反了,浪费了很多时间,原因是网页一般解码是utf-8的,但是这个原数据是gbk格式的,所以需要将他进行gbk解码,在编码为utf-8格式。代码如下
A = "濂ュ厠鏂┖璋冧紒涓氫細鍛樻洿浼樻儬"
A = A.encode('gbk',errors="ignore").decode("utf-8",errors="ignore")
print(A)
>>> 奥克斩调企业会员更优惠
爬虫网页乱码gbk转utf-8,utf-8转gbk如濂ュ厠鏂。