基础知识
1、爬取网页时要分析网页结构
如:https://www.cnblogs.com/#p2,p2是灵活的每一页
2、xpath支持正则表达式,可以选择两个方式,一是通过chrome选择Xpath,二是选择class
本文介绍了爬虫的基础知识,包括分析网页结构的方法,并详细解释了如何使用XPath进行页面元素定位,支持正则表达式的特性使得XPath在抓取特定内容时更加灵活高效。
基础知识
1、爬取网页时要分析网页结构
如:https://www.cnblogs.com/#p2,p2是灵活的每一页
2、xpath支持正则表达式,可以选择两个方式,一是通过chrome选择Xpath,二是选择class
1846

被折叠的 条评论
为什么被折叠?