mechanize相关知识准备:
mechanize.Browser()<br># 设置是否处理HTML http-equiv标头
set_handle_equiv(True)<br># 设置是否处理重定向
set_handle_redirect(True)<br># 设置是否向每个请求添加referer头
set_handle_referer(True)<br># 设置是不遵守robots中的规则
set_handle_robots(False)<br># 处理giz传输编码
set_handle_gzip(False)<br># 设置浏览器的头部信息
登录代码如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
import mechanize br = mechanize.Browser() br.set_handle_robots( False ) #表示不遵循robots中的规则 url = 'http://mail.sina.com.cn/' br.addheaders = [( 'User-agent' , '*' )] br. open (url) for form in br.forms(): #查看登录页面中的表单 print form br.select_form(nr = 0 ) br[ 'local' ] = '用户名' br[ 'pwd' ] = '密码' response = br.submit() print 'success' for link in br.links(): print link.url + ':' + link.text |