
爬虫小项目
moshanghuali
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
selenium+bs4库爬取京东商城戴尔显示器数据
def main(): from spider_re import get_html, get_info, save_info url = 'https://item.jd.com/2316993.html#comment' html_list = get_html.get_html(url, 20) data = get_info.get_info(html...原创 2019-04-13 10:44:07 · 368 阅读 · 0 评论 -
re和requests库爬取豆瓣电影短评
1 从url分析可以知道,每翻一页评论的话,url只是在start=的位置发生变动。因此分析出规律后,不断循环迭代即可爬取多页评论资源。2 此次爬取的主要内容是,短评内容,有用数,评论者昵称,评论时间,评星数。这五方面的内容。下面直接上代码。def get_info(page_num): # 导入相应的库 import requests ...原创 2019-04-17 21:18:05 · 1003 阅读 · 1 评论