
爬虫
interestingπ
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python3爬虫 —— 爬取丁香园网站的信息
利用BeautifulSoup和lxml两个模块爬取丁香园网站的回复信息BeautifulSoup实现代码:from bs4 import BeautifulSoupimport requests#访问的网址url = 'http://www.dxy.cn/bbs/thread/626626#626626'#头部信息headers = { 'user-agent':'Moz...原创 2019-04-10 23:04:09 · 2142 阅读 · 0 评论 -
python3爬虫 —— 爬取豆瓣电影信息
代码:import re,xlwt,requests#初始化并创建一个工作簿book = xlwt.Workbook()#创建一个名为sheetname的表单sheet = book.add_sheet('movie') #重复写入数据headings = [u'排名', u'电影名称',u'导演',u'国家',u'年份',u'评分']k =0for j in headings...原创 2019-04-07 21:24:05 · 4279 阅读 · 6 评论 -
python3爬虫——模拟登录QQ邮箱
该教程是通过selenium实现的安装selenium:到这个网址选取与自己系统符合的下载,下载后解压后把 exe文件 放到你电脑安装python 的根目录,下图是我的目录之后将这个 exe文件 的路径写到系统环境变量的 path 下,如图:之后在 cmd 窗口中输入 pip install selenium 即可实现代码:在这里插入代码片...原创 2019-04-12 22:48:34 · 4921 阅读 · 0 评论 -
python3爬虫——模拟登录丁香园并提取信息
代码:from selenium import webdriverimport timefrom lxml import etree#模拟登陆丁香园网站browser = webdriver.Firefox()browser.get('https://auth.dxy.cn/accounts/login?service=http://www.dxy.cn/bbs/thread/626...原创 2019-04-13 23:39:05 · 1280 阅读 · 0 评论