Python爬虫-11-response.text出现乱码的解决方案

最新推荐文章于 2025-06-15 18:09:28 发布

karry_孙二

最新推荐文章于 2025-06-15 18:09:28 发布

阅读量7.4k

点赞数

CC 4.0 BY-SA版权

分类专栏： Python爬虫

本文链接：https://blog.youkuaiyun.com/qq_39620483/article/details/90207933

在进行Python爬虫时，遇到response.text显示乱码的情况。通过分析，发现可能是返回内容被压缩。通过使用response.content.decode('utf-8')转换编码，成功解决了乱码问题，使得页面内容能正常显示。

代码如下：

# 这里是封装的一个下载url页面的方法


import requests

def download_page(url, user_Agent=None, referer=None):
    print("Downloading:",url)
    headers = {
        "Referer":referer,
        "User-Agent":user_Agent
    }
    response = requests.get(url=url,headers=headers)
    try:
        html = response.text
    except Exception as e:
        print("Download error:",e)
        html = None
    return html

if __name__ == '__main__':
    u = "http://192.168.1.19:8080/edu/"
    u_a = "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Safari/537.36"
    print(download_page(url=u, user_Agent=u_a))