背景:淘宝的Ajax加密处理,不方便直接解析Ajax请求数据,所以利用selenium库实现模拟爬取
架构:

第一:主要的思路

第二:定义mongodb是类,实现数据存储

主要注意的是,mongodb用户名和密码的问题。
第三:爬取产品搜索结果页面

第四:解析具体的product

第五:源码
import pymongo
from selenium.webd
背景:淘宝的Ajax加密处理,不方便直接解析Ajax请求数据,所以利用selenium库实现模拟爬取
架构:



主要注意的是,mongodb用户名和密码的问题。


import pymongo
from selenium.webd
1172
2300

被折叠的 条评论
为什么被折叠?