主要技术栈:
- python2.7
- scrapy
- xpath / re定位元素
- selenium模拟浏览器
虽然Spider爬虫主文件不超50行,但更多的是调试javascript
本文介绍了一种使用Python 2.7与Scrapy框架结合XPath及正则表达式进行网页元素定位的方法,并通过Selenium模拟浏览器行为来调试复杂的JavaScript代码。
主要技术栈:
- python2.7
- scrapy
- xpath / re定位元素
- selenium模拟浏览器
虽然Spider爬虫主文件不超50行,但更多的是调试javascript
1132

被折叠的 条评论
为什么被折叠?