f = urllib2.urlopen(url,timeout=10)
data = f.read()
# decode the html
contentType = f.headers.get('Content-Type')
if contentType.find("gbk"):
data = unicode(data, "GBK").encode("utf-8")
elif contentType.find("utf-8"):
pass
转载于:https://www.cnblogs.com/shijiaoyun/p/4469470.html
使用urllib2获取网页内容并处理编码方式
本文详细介绍了如何使用urllib2库获取网页内容,并根据不同网页的编码方式(如GBK和UTF-8)进行解码操作。通过实例演示了网页内容的读取与编码转换过程。
1507

被折叠的 条评论
为什么被折叠?



