Python爬虫
杰出的小茄子
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Python 模拟浏览器访问网页,Selenium库的详细使用
(一)Selenium基础入门教程:Selenium官网教程1.Selenium简介Selenium是一个用于测试网站的自动化测试工具,支持各种浏览器包括Chrome、Firefox、Safari等主流界面浏览器,同时也支持phantomJS无界面浏览器。2.支持多种操作系统如Windows、Linux、IOS、Android等。3.安装Seleniumpip install Selenium14.安装浏览器驱动Selenium3.x调用浏览器必须有一个webdriver驱动文件Ch转载 2020-08-21 14:31:26 · 12408 阅读 · 0 评论 -
Python评论爬虫实战,爬取<什么值得买>的所有评论并生成txt结果文件
安装需要的包#!pip install chardet#!pip list#!pip install bs4构造请求头headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36' }# 构造请求头,主网站的请求头较为简单只需构造浏览器头import需要的包原创 2020-08-18 10:12:38 · 1397 阅读 · 1 评论 -
Python BeautifulSoup,bs4,使用正则化进行查找
先给出网址内容<html><head><title>The Dormouse's story</title></head><body><p class="title" id="hehe"><b>The Dormouse's story</b></p><p class="story" id="firstpara">Once upon a time there were t原创 2020-08-17 21:06:39 · 1600 阅读 · 0 评论
分享