
爬虫
文章平均质量分 73
YYIverson
keep going.
展开
-
【爬虫】Selenium Python3 请求头配置
转载出处:https://blog.youkuaiyun.com/u013440574/article/details/81911954Selenium官方文档https://seleniumhq.github.io/selenium/docs/api/py/api.html谷歌浏览器一、chromeOptions相关配置chromeOptions 是一个配置 chrome 启动是属性的类。通过...转载 2019-04-16 10:41:45 · 829 阅读 · 0 评论 -
【爬虫】BeautifulSoup的常用用法介绍
BeautifulSoup的常用用法介绍参考博客:https://blog.youkuaiyun.com/c406495762/article/details/71158264 官方文档链接(中文版)注:本博客对参考播客中的BeautifulSoup内容做了重要点提取,点击下面的链接进入有道云笔记看博客详细内容https://note.youdao.com/ynoteshare1/index.ht...原创 2019-04-13 23:40:00 · 621 阅读 · 0 评论 -
【爬虫】Selenium的基础使用
selenium:作用:可以模拟真实浏览器,是web自动化测试工具,支持多种浏览器官方文档:http://selenium-python.readthedocs.io/index.html使用前:1、安装驱动2、放入环境变量或Anaconda的Script文件夹或者手动输入驱动的pathfrom selenium import webdriver options=webdr...原创 2019-04-14 21:25:58 · 205 阅读 · 0 评论 -
【爬虫】Python Selenium爬取TEDTalks
1、爬虫相关:TED-Talks的视频(www.ted.com/talks) 云集了曾踏上过TED讲坛、举世闻名的思想家、艺术家和科技专家。在TED.com网站上,我们可以免费下载这些视频。视频包含了可以互动的英文讲稿以及多达80多个语种的字幕。这次的爬取场景是将某个演讲视频下英语和匈牙利语的字幕稿给抽取出来并一一对应后写入文件,并利用Selenium随机点击下一个视频,不断执行上述操作。英...原创 2019-04-22 20:17:46 · 1509 阅读 · 1 评论 -
【爬虫】Scrapy框架的介绍
Scrapy框架的介绍一、框架介绍1、各组件介绍Scrapy Engine(Scrapy核心): 负责数据流在各个组件之间的流Spiders(爬虫): 用于分析和提取数据及获取新的request请求,将得到的item交给Item Pipeline,将新的request请求再交给Scrapy EngineScheduler(调度器) : 接受Scrapy Engine传输的request...原创 2019-04-19 18:32:10 · 492 阅读 · 0 评论 -
【爬虫】牛客网简易爬虫(一)看看哪些开始秋招的公司你还没看
目录一、需求二、简单网站分析三、代码四、代码输出在 牛客网--求职--校招日程可以看到秋招的互联网公司。不过里面有一些是亮的就是已开始,灰的就是还没开始或者已经结束。如下图。一、需求博主在看完一家公司后,都会把它记在excel中的“已看”列,代表这家公司我已经看过。如下图,只截取部分。注意添加在excel的时候要是公司全名不然后面会很难受哈哈。然后我...原创 2019-09-06 00:08:52 · 533 阅读 · 1 评论 -
【爬虫】牛客网简易爬虫(二)用Selenium看看你投过简历的公司这个月哪些有笔试+笔试时间
在 牛客网--求职--笔试日历 可以笔试时间每天都有哪些公司有笔试,如下图一、需求1、看看这个有笔试的公司哪家你还没看过。2、看看自己投过的公司哪家这个月有笔试及笔试的时间。当然,你还是得把你投的记在excel中,把已笔试的也记下来!2、代码from selenium import webdriverfrom collections impor...原创 2019-09-06 00:30:44 · 740 阅读 · 0 评论