数据采集、提取与处理:XPath、Scrapy及文件格式操作全解析
1. XPath与CSS选择器的使用
1.1 选择特定元素
可以使用XPath和CSS选择器来选择特定的元素。例如,选择所有类名为“planet”的 <tr> 元素:
[(v, v.xpath("@name")) for v in tree.cssselect('tr.planet')]
输出结果如下:
[(<Element tr at 0x10d3a2278>, ['Mercury']),
(<Element tr at 0x10c16ed18>, ['Venus']),
(<Element tr at 0x10e445688>, ['Earth']),
(<Element tr at 0x10e477228>, ['Mars']),
(<Element tr at 0x10e477408>, ['Jupiter']),
(<Element tr at 0x10e477458>, ['Saturn']),
(<Element tr at 0x10e4774a8>, ['Uranus']),
(<Element tr at 0x10e4774f8>, ['Neptune']),
(<Element tr at 0x10e477548>, ['Pluto'])]
超级会员免费看
订阅专栏 解锁全文
607

被折叠的 条评论
为什么被折叠?



