Python使用mechanize模拟登录、抓取数据的代码

本文介绍了一个Python脚本,该脚本利用Mechanize和Cookielib库实现自动化登录,并从特定网站抓取数据。通过设置浏览器属性、处理重定向和设置表单数据,最终成功登录并抓取指定日期的数据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

http://blog.youkuaiyun.com/cnweike/article/details/8076440


  1. import mechanize  
  2. import cookielib  
  3.   
  4.   
  5. br = mechanize.Browser()  
  6. cj = cookielib.LWPCookieJar()  
  7. br.set_cookiejar(cj)  
  8. br.set_handle_equiv(True)  
  9. br.set_handle_gzip(True)  
  10. br.set_handle_redirect(True)  
  11. br.set_handle_referer(True)  
  12. br.set_handle_robots(False)  
  13.   
  14. br.set_handle_refresh(mechanize._http.HTTPRefreshProcessor(), max_time=1)  
  15. br.set_debug_http(False)  
  16.   
  17. br.addheaders = [('User-agent''Mozilla/5.0 (Windows NT 6.1; WOW64; rv:15.0) Gecko/20100101 Firefox/15.0.1')]  
  18.   
  19. response = br.open('http://xxxx/signon')  
  20. br.select_form(name='loginFrm')  
  21. br.form['userName'] = 'xxx'  
  22. br.form['password'] = 'yyy'  
  23. br.submit()  
  24. print 'login successful!'  
  25. response = br.open('http://xxxx/app/application/attendmanage/vieworiginaldata.jsp')  
  26. br.select_form(name='form1')  
  27. br.form.set_all_readonly(False)  
  28. br.form.action = 'http://xxxx/app/servlet/ViewOriginalDataServlet'  
  29. br.form['fromdate'] = '2012-09-05'  
  30. br.submit()  
  31. print br.response().read()  

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值