
python
MHSMIE
这个作者很懒,什么都没留下…
展开
-
pytho爬虫中文乱码解决方法
刚接触BeautifulSoup,在命令行输出爬取到网页的内容时,中文一直是乱码,很气。中文乱码很容易想到是编码不对的问题,可是对编码方式的原理老姐也不多,对这个工具也不是很了解,只能硬着头皮去尝试,反正最后一定能解决首先是遇到的问题源码为# -*-coding:utf-8 -*-import urllibimport urllib2url="http://www.baid原创 2017-05-15 17:12:17 · 1107 阅读 · 0 评论 -
chardet检测爬到的网页的编码
下载地址使用方法,将压缩包解压,将里面的文件复制到python安装目录下的\Lib\site-packages下import chardet import urllib #可根据需要,选择不同的数据 TestData = urllib.urlopen('http://www.baidu.com/').read() print chardet.detect(TestDa原创 2017-05-15 21:14:49 · 627 阅读 · 2 评论