scrapy爬虫调试得到结果如下:
此时,再将response获得源代码另存,用edge打开,显示如下:
使用控制台验证定位的xpath路径表达式如下:
仔细观察,爬取同一网页的结果,发现只含有网页显示的table元素的子元素tr,且此tr的子元素首个td节点不同的首个符合要求的tr元素节点,现象如下:
这样四个tr元素节点的内容,被正常爬取,爬取时打印信息如下:
scrapy爬虫调试得到结果如下:
此时,再将response获得源代码另存,用edge打开,显示如下:
使用控制台验证定位的xpath路径表达式如下:
仔细观察,爬取同一网页的结果,发现只含有网页显示的table元素的子元素tr,且此tr的子元素首个td节点不同的首个符合要求的tr元素节点,现象如下:
这样四个tr元素节点的内容,被正常爬取,爬取时打印信息如下: