python 爬虫
文章平均质量分 72
psyear
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
[python 爬虫学习]利用cookie模拟网站登录
利用cookie模拟登陆西安交通大学的门户系统并将cookie信息保存到文本文件中#coding:utf-8import cookielibimport urllibimport urllib2filename = 'cookie.txt'#声明一个MozillaCookieJar对象实例来保存cookie,之后写入文件cookie = cookielib.MozillaCook原创 2015-08-01 14:12:46 · 2720 阅读 · 0 评论 -
将豆瓣电影top250排名在文本文档中保存
作为python爬虫的第一个试手小程序,因为豆瓣电影top250的获取不需要进行登陆,因此完成这个任务主要是正则表达式和url开启的使用。不过由于python2的一些处理中文编码的缺陷,因此在进行中文匹配时会遇上一些问题,如果是全英文如imbd、billboard这些榜单的获取,所需要解决的问题将要少很多。以下是主程序,只截取了具有代表性的“电影名”、“评分”和“主演”这三项信息,其他如年份等原创 2015-09-25 17:57:25 · 2809 阅读 · 0 评论
分享