#去掉tbody!
原://*[@id="content"]/div[3]/table/tbody/tr[2]/td[1]/text()
去掉后://*[@id="content"]/div[3]/table/tr[2]/td[1]/text()
直接复制浏览器路径的是没错,显示不出来,说明路径肯定有问题。应该是浏览器自动加了tbody节点导致最终解析的时候没有。
我们爬的时候,是下面这种文件,最下面的日期是我想要获取的数据。可以看到其中,并没有出现tbody这样的节点,而是<!-- Baidu Button END --> 这种。
<div id="content" class="wdetail">
<h1>
2020年1月西安空气质量指数AQI_PM2.5历史数据
</h1>
<!-- Baidu Button BEGIN -->
<div id="bdshare" class="bdshare_t bds_tools get-codes-bdshare">
<span class="bds_more">分享到:</span>
<a class="bds_tsina"></a>