一个小脚本遇到的问题之python查看网站编码

本文讨论了Python编码问题,特别关注2.7.10版本与3.0版本之间的差异,并提供了一个查看网站编码的方法,包括使用chardet模块进行内容分析。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

[size=11]
[url=http://lovekaiyuan.iteye.com/admin/blogs/2286546]那个脚本的样子[/url]
[color=red]第一个问题[/color]是编码问题,这里是以2.7.10为例,3.0以后的编码有很大的变化。
不过这里因为正好躲过,所以没有多做研究。不过大家可以参考[url="http://www.pythontab.com/html/2013/pythonhexinbiancheng_0114/129.html"][color=red]这里[/color][/url]。介绍了一个查看网站编码的方法。个人没有验证,等用到的时候在做详细的记录。里面介绍了两个方法,摘录靠谱的那个如下:
[/size]


# 原文网址:http://www.pythontab.com/html/2013/pythonhexinbiancheng_0114/129.html
#如果你的python没有安装chardet模块,你需要首先安装一下chardet判断编码的模块

import chardet
import urllib
#先获取网页内容
data = urllib.urlopen('http://www.pythontab.com').read()
#用chardet进行内容分析
chardit = chardet.detect(data)

data1 = urllib.urlopen('http://www.baidu.com').read()

chardit1 = chardet.detect(data1)

print chardit['encoding'] # pythontab

print chardit1['encoding'] # baidu

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值