python编码问题

用Python requests获取网页数据时 发现一个问题 返回的数据text部分可能会是乱码

t = requests.post(url, data=params, headers=header)
print(t.text)
<li >ç¨æ·å为ä¸å¡éå·ï¼å¯ç 为身份è¯å·ç åå­ä½ï¼èº«ä»½è¯å6ä½å¸¦æXçX为大åã(ä¸ªå«æå¸èº«ä»½è¯å·ç 为15ä½)</li>
           <li style="list-style-type: none;"><br/></li>
           <li >å¯ç å¨è¿å¥ç³»ç»åå¯ç±è¯»èéæ°è®¾ç½®</li>
           <li style="list-style-type: none;"><br/></li>
           <li>éäºéè§è¯»èåéç¨è¯è¯»èç¨æ·åååå§å¯ç ä»ä¸ºè¯ä»¶å·</li>
           <li style="list-style-type: none;"><br/></li>
           <li>Emailç±æ¨èªè¡è®¾å®ï¼ç»éåå¯ä»¥ä¿®æ¹</li>
           <li style="list-style-type: none;"><br/></li>
           <li>å¯ç ååéè¦æ¨é¦åéªè¯æ¨çEmail</li>
        

看来是解码问题,去官方文档看一下
找了半天,发现这个
747819-20160507104742435-256807430.png

大意就是说返回内容根据http头里面的内容编码,如果头里面没有指定的话就可能出现编码错误
所以只要先前指定就可以了

t = requests.post(url, data=params, headers=head)
t.encoding = "Unicode"
print(t.text)

<li >用户名为一卡通号,密码为身份证号码后六位,身份证后6位带有X的X为大写。(个别教师身份证号码为15位)</li>
           <li style="list-style-type: none;"><br/></li>
           <li >密码在进入系统后可由读者重新设置</li>
           <li style="list-style-type: none;"><br/></li>
           <li>限于阅览读者和通用证读者用户名和初始密码仍为证件号</li>
           <li style="list-style-type: none;"><br/></li>
           <li>Email由您自行设定,登陆后可以修改</li>
           <li style="list-style-type: none;"><br/></li>
           <li>密码取回需要您首先验证您的Email</li>

问题解决

转载于:https://www.cnblogs.com/huchpclu/p/5467917.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值