需要引用chardet 模块
测试用例:
import urllib.request
import chardetuser_agent = 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.0.7) Gecko/2009021910 Firefox/3.0.7'
url = "http://blog.youkuaiyun.com/bo_wen_/article/details/50868339"
headers={'User-Agent':user_agent,}
request=urllib.request.Request(url,None,headers) #The assembled request
response = urllib.request.urlopen(request)
data = response.read() # The data u need
chardit1 = chardet.detect(data)
print("编码格式"+chardit1['encoding'])
本文介绍了一个简单的Python脚本,用于检测指定网页的字符编码格式。通过使用urllib.request和chardet模块,该脚本能够发起HTTP请求并读取响应数据,进而分析并输出网页的实际编码类型。
1万+

被折叠的 条评论
为什么被折叠?



