- 博客(2)
- 收藏
- 关注
原创 网页内容解析(Scrapy)
当我们取得了网页的response之后,最关键的就是如何从繁杂的网页中把我们需要的数据提取出来是一个基于 ElementTree (不是Python标准库的一部分)的python化的XML解析库(也可以解析HTML)。你可以在scrapy中使用任意你熟悉的网页数据提取工具,但是,scrapy本身也为我们提供了一套提取数据的机制,我们称之为选择器(seletors),他们通过特定的 XPath 或者 CSS 表达式来“选择” HTML文件中的某个部分。
2024-10-22 11:27:05
723
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人