
网络爬虫
Lavi_qq_2910138025
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Scrapy选择器Selector
当抓取网页时,常见的任务是从HTML源码中提取数据。现有的一些库可以达到这个目的:BeautifulSouplxmlScrapy 提取数据有自己的一套机制。它们被称作选择器(seletors),因为他们通过特定的 XPath 或者 CSS 表达式来“选择” HTML 文件中的某个部分。构造选择器Scrapy selector 是以 文字(Text)或 TextR转载 2017-05-01 19:43:32 · 1638 阅读 · 0 评论 -
python爬虫爬取内容中,\xa0,\u3000的含义
本文讲解了在使用python爬取数据时常见的\xa0、\u3000的含义转载 2017-05-01 21:41:59 · 4865 阅读 · 0 评论