最近在做网页正文标签提取, 在用requests.get取网页内容的的过程中,对于.htm结尾文件,发现抓取的内容中汉字是乱码,查了一下,下面一个方案可以解决问题 Python requests库中文乱码问题