
python
文章平均质量分 83
markximu
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python模拟登录的实现
本文主要用python实现了对网站的模拟登录。通过自己构造post数据来用Python实现登录过程。当你要模拟登录一个网站时,首先要搞清楚网站的登录处理细节(发了什么样的数据,给谁发等...)。我是通过HTTPfox来抓取http数据包来分析该网站的登录流程。同时,我们还要分析抓到的post包的数据结构和header,要根据提交的数据结构和heander来构造自己的post数据和hea转载 2013-04-03 18:25:58 · 809 阅读 · 0 评论 -
python urllib模块详解及实例
python urllib模块详解及实例先看一个例子,这个例子把Google首页的html抓取下来并显示在控制台上: import urllib print urllib.urlopen('http://www.google.com').read() # 别惊讶,整个程序确实只用了两行代码import urllibprint urllib.urlopen('ht转载 2013-04-03 19:52:52 · 580 阅读 · 0 评论 -
HTMLParser模块详解
使用HTMLParser模块解析HTML页面 HTMLParser是python用来解析html和xhtml文件格式的模块。它可以分析出html里面的标签、数据等等,是一种处理html的简便途径。HTMLParser采用的是一种事件驱动的模式,当HTMLParser找到一个特定的标记时,它会去调用一个用户定义的函数,以此来通知程序处理。它主要的回调函数的命名都是以hand转载 2013-04-03 19:54:08 · 932 阅读 · 0 评论 -
python urllib2详解及实例
urllib2是Python的一个获取URLs(Uniform Resource Locators)的组件。他以urlopen函数的形式提供了一个非常简单的接口,这是具有利用不同协议获取URLs的能力,他同样提供了一个比较复杂的接口来处理一般情况,例如:基础验证,cookies,代理和其他。它们通过handlers和openers的对象提供。 urllib转载 2013-04-03 18:30:25 · 614 阅读 · 0 评论 -
登陆新浪微博&批量下载收藏内容
1.脚本模拟登陆新浪微博,保存cookie2.有了cookie信息后,访问收藏页面url3.从第一页开始,逐步访问,直到最后,脚本中进行了两步处理 A.直接下载网页(下载到本地,当然,要看的时候需要联网,因为js,图片神马的,都还在) B.解析出微博需要的内容,目前只是存下来,还没有处理 后续会用lxml通过xpath读取,转换成文档,当然,图片和视频链接也转载 2013-04-04 19:53:57 · 1367 阅读 · 0 评论 -
Python模拟登陆新浪微博并实现投票功能
#coding=utf8import urllibimport urllib2import cookielibimport base64import reimport jsonimport hashlibimport timefrom django.template.defaultfilters import urlencode#获取一个保存cookie的对象cj = co转载 2013-04-04 20:50:17 · 992 阅读 · 0 评论