数据挖掘
文章平均质量分 72
maverick1990
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python抓取中文网页显示乱码问题
问题:使用python抓取中文网页,print时中文显示乱码抓取代码:import urllib2,urllib,cookielib,threadingimport osimport re url = 'http://www.dugukeji.com/' #抓取的url req = urllib2.Request(url) response = urllib2.ur原创 2013-05-03 14:27:40 · 15186 阅读 · 0 评论 -
Python抓取网页&批量下载文件方法初探(正则表达式+BeautifulSoup)
最近两周都在学习Python抓取网页方法,任务是批量下载网站上的文件。对于一个刚刚入门python的人来说,在很多细节上都有需要注意的地方,以下就分享一下我在初学python过程中遇到的问题及解决方法。一、用Python抓取网页基本方法:import urllib2,urlliburl = 'http://www.baidu.com'req = urllib2.Req原创 2013-05-09 14:31:46 · 43001 阅读 · 4 评论
分享