Python爬虫（四）——模拟登录imooc实战(利用cookie)

最新推荐文章于 2022-02-13 17:16:36 发布

原创最新推荐文章于 2022-02-13 17:16:36 发布 · 1.3k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#python #爬虫 #模拟登录

● Python数据获取/处理专栏收录该内容

19 篇文章

订阅专栏

本文介绍了一种使用Python模拟登录慕课网的方法，并通过获取和保存Cookie实现了访问个人课程页面的功能。文中提供了完整的代码示例，展示了如何利用urllib2和cookielib库进行网页登录。

该实战是模拟登录慕课网，并且进入个人课程页面

一、思路

1、获取登录cookie，并保存。

2、进入个人课程页面

二、代码

#!/usr/bin/env python
# -*- coding:utf-8 -*-
# author: xulinjie time:2017/11/1
import urllib2
import urllib
import cookielib

filename='cookie.txt'
cookie=cookielib.MozillaCookieJar(filename)
headler=urllib2.HTTPCookieProcessor(cookie)
opener=urllib2.build_opener(headler)
value={"email":"xxxxxxx","password":"xxxxxxxx"}
data=urllib.urlencode(value)#转码
loginURL=r'http://www.imooc.com/'#因为登录页面和首页是在一起的
opener.open(loginURL,data)#模拟登录，并把cookie保存到变量
cookie.save(ignore_discard=True,ignore_expires=True)#保存cookie到cookie.txt中
myURL=r'http://www.imooc.com/u/6085318/courses'#个人课程的URL
result=opener.open(myURL).read()#读取个人课程页面
wfile=open(r'./1.html',r'wb')
wfile.write(result)
wfile.close()
print result