
Python爬虫
千与千寻.i
这个作者很懒,什么都没留下…
展开
-
使用Selenium爬取前程无忧网站最新发布的前五页招聘信息
本文主要使用Selenium调用谷歌浏览器,爬取前程无忧(https://mkt.51job.com)网站最近发布的招聘信息的前五页内容(本文以数据分析师为例子进行爬取),完整代码如下。 from selenium import webdriver from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.support.ui import WebDriverWait from...原创 2020-05-25 21:51:47 · 1576 阅读 · 2 评论 -
使用xpath解析网页的实例(完整代码)
本文以解析搜狗网页为例,使用xpath方法解析出来它的十个搜锁热词,代码简洁通俗易懂,非常适合初学者入门。完整代码如下: #导入相关库 import requests from lxml import etree #发送HTTP请求及响应 url='https://weixin.sogou.com/' rqq=requests.get(url) #将rqq对象转换为DOM html=etree.HTML(rqq.content,etree.HTMLParser(encoding='utf-8'))原创 2020-05-21 18:13:19 · 2097 阅读 · 1 评论 -
使用selenium获取图书信息实例(完整代码)
本文以人名邮电出版社官网为例来获取相关搜索内容图书的价格和书名信息,得到的结果再通过pandas里的DataFrame生成一个简单的表格。完整代码和有关解析如下: #导入selenium的相关库 from selenium import webdriver from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.support.ui import WebDriverWait ...原创 2020-05-18 20:06:57 · 1585 阅读 · 0 评论