【网络爬虫基础】Task01 HTTP、网页基础、requests、API、JS
摘录自:
team-learning-program
概念部分:
(只记对自己来说重要的点)
1、值得一提的是快捷菜单中的“Copy XPath”选项。由于XPath是解析网页的利器,因此Chrome中的这个功能对于爬虫程序编写而言就显得十分实用和方便了。
2、对于需要填写并发送表单的网页而言(比如执行用户登录操作,以百度贴吧为例),在“Network”面板勾选“Preserve log”复选框,然后进行登录,就可以记录HTTP POST信息,查看发送的表单信息详情。
3、一个网络爬虫程序最普遍的过程:
访
原创
2020-10-22 22:48:24 ·
192 阅读 ·
0 评论