写在前面
在编写爬虫的过程中,熟练的使用一些工具能高效的提高你爬虫代码编写的速度,本篇博客我们短暂性的休息下,给大家介绍一下我在编写爬虫代码编写的过程中,都使用了哪些工具,这些工具你可以酌情安装一下,没准在哪天,它们能帮助到你。
爬虫世界工具清单
谷歌浏览器
开发爬虫必备,浏览器我建议就使用这个吧,其他的也确实不怎么好使,浏览器上的工具,主要有下面这些。
谷歌开发者工具
没错,就是按 F12 出现的开发者工具,长成下图这个样子,这里面提供了非常多调试网页的工具,虽然我们不是前端工程师,但是这些工具必不可少。例如下面的Elements
,Network
,写爬虫的时候,哪一个每天不点上几十遍都不舒服。 如果你使用的是其他浏览器,开发者工具基本类似,这个主要依赖编码者的习惯,有的人就喜欢用火狐浏览器,毕竟那个是中文~
谷歌浏览器插件/扩展
除了自带的开发者工具意外,有些浏览器的扩展我们是很有必要安装一下的 ,这里其实有个非常 6 的爬虫扩展,叫做Web Scraper
我们这里先不展开说,因为我后面要单独写一篇博客去描述它,我们先把一些常用的小扩展,给大家罗列一下。
第一个是我最常用的,叫做XPath helper
,因为对于我来说,最常用的网页内容解析方式除了正则表达式以外,就是 xpath 解析方式了,安装它之后,你可以快速的在网页上面高亮显示某些选择区域。安装过程这里不细说,毕竟在国内去访问谷歌插件市场还是需要些特殊办法的。
当然,你可以直接访问国内的一些网站去下载,这种好的扩展一定有人提供的,例如,优快云 下载频道搜索一下,就有~
第二个是Regex Matcher
- 正则表达式匹配器,也就是在插件中调试正则表达式,一会我还会给大家介绍一些软件中,在本地有个类似的软件相较于这款插件更加优秀一些,不过插件免费,软件收费(有办法免费,你懂的)
第三个是油猴
,这个就不在过多的介绍了,一入油猴,哇哦~浏览器都变的不一样了呢,因为名气比较大,稍微检索一下,好多东西可以学习。
第四个是EditThisCookie
插件,对于一个爬虫爱好者,看到名字你就知道这是干什么的了,没错 EditThisCookie 是一款可以管理 Chrome 浏览器中 Cookies 的插件,你可以利用 EditThisCookie 添加,删除,编辑,搜索,锁定和屏蔽 Cookies。
一些下载插件的网站
关于插件的安装,就不做过多的解释了,都是比较容易的~,即使不会,在上面两个网站上也可以找到很多安装的办法。
桌面工具类
第一款必然是RegexMatchTracer
这款工具陪伴我多年,个人觉得是最好用的正则表达式匹配工具了,工具用得好,爬虫少烦恼~
下载地址:pan.baidu.com/s/1hqKKrre (来源互联网)
打开之后,长成下面这个样子,如果上述链接下载不了,给我留言,我发给你。
第二款也是正则表达式匹配工具,叫做
Regester
,官方网址:deerchao.cn/tools/reges… ,你可以和上述软件同时使用一下,然后对比一下,选一个自己喜欢的。
第三款软件,叫做postman
,开发调试必备软件,看一下官方简介,起飞~,一定要弄一个在自己的电脑本地,熟练使用之后,你会惊叹于自己的选择,这软件真棒!
postman 是一款强大网页调试工具的客户端,postman 为用户提供强大的 Web API & HTTP 请求调试功能。postman 能够发送任何类型的 HTTP 请求 (GET, HEAD, POST, PUT…),附带任何数量的参数+ headers,是一款非常实用的调试工具。
当然 postman 也有可替代的谷歌插件,有时候我会选择使用Talend API Tester
,如果你想要学习一下,可以检索学习一下。
第四款软件,抓(he)包(xie)类的了,我推荐fiddler
(HTTP 调试抓(he)包(xie)工具),你如果去使用Charles
也是可以的,不过后者是收费的,这两款工具目的比较一致,咱们的爬虫系列教程都有所讲解,可以翻看前面的博客进行学习。
第五款软件,Snipaste
,一款截图工具,肯定有人好奇,为啥我开发一个爬虫程序,还需要一个截图工具呢,这款截图工具截取图片之后,可以钉在桌面上,我们在编写爬虫的时候,经常要反复的核对参数,那么比对参数的时候截取一下屏幕,钉在屏幕上,会节省很多时间。
在线工具类
第一款,JSON 在线格式化,具体网站因为太多,不做推荐,直接百度即可,对于一个爬虫编写者,不随身收集几个 JSON 解析的网站或者了解一下 JSON 语法格式,这个实在说不过去。
同理,你还需要 JS 在线格式化工具,方便查阅某些被压缩过得 JS 代码
开发工具
这个没有什么要说的,VScode 或者 PyCharm(Community 版本免费,够用)
题外话
在此疾速成长的科技元年,编程就像是许多人通往无限可能世界的门票。而在编程语言的明星阵容中,Python就像是那位独领风 骚的超级巨星, 以其简洁易懂的语法和强大的功能,脱颖而出,成为全球最炙手可热的编程语言之一。
Python 的迅速崛起对整个行业来说都是极其有利的 ,但“人红是非多
”,导致它平添了许许多多的批评,不过依旧挡不住它火爆的发展势头。
在下个十年的剩余时间里,Python 还能如此重要以及保持完整性吗?今天,我们将对事实进行分析,破除一些误解。
优快云大礼包:全网最全《全套Python学习资料》免费分享🎁
😝朋友们如果有需要的话,可以扫描下方二维码免费领取🆓
如果你对Python感兴趣,想通过学习Python获取更高的薪资,那下面这套Python学习资料一定对你有用!
资料包括:Python安装包+激活码、Python web开发,Python爬虫,Python数据分析,人工智能、机器学习等学习教程。0基础小白也能听懂、看懂,跟着教程走,带你从零基础系统性地学好Python!
这份完整版的Python全套学习资料已经打包好,需要的小伙伴可以戳下方链接免费领取
一、Python所有方向的学习路线
Python所有方向路线就是把Python常用的技术点做整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
二、Python学习软件
工欲善其事,必先利其器。学习Python常用的开发软件都在这里了!
三、Python入门学习视频
还有很多适合0基础入门的学习视频,有了这些视频,轻轻松松上手Python~
四、Python练习题
每节视频课后,都有对应的练习题哦,可以检验学习成果哈哈!
五、Python实战案例
光学理论是没用的,要学会跟着一起敲代码,动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。这份资料也包含在内的哈~
六、Python面试资料
我们学会了Python之后,有了技能就可以出去找工作啦!下面这些面试题是都来自阿里、腾讯、字节等一线互联网大厂,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。
七、资料领取
上述完整版Python全套学习资料已经上传优快云官方,需要的小伙伴可自行微信扫描下方优快云官方认证二维码免费领取
这份完整版的Python全套学习资料已经打包好,需要的小伙伴可以戳下方链接免费领取