
爬虫
请叫我算术嘉
快手HDFS
展开
-
Scrapy爬虫入门(一)---爬取猫眼榜单
安装Scrapy pip3 install scrapy 新建工程 scrapy startapp maoyan 目录结构 scrapy.cfg:配置文件 spiders:存放你Spider文件,也就是你爬取的py文件 items.py:相当于一个容器,和字典较像 middlewares.py:定义Downloader Middlewares(下载器中间件)和Spider...原创 2020-03-04 21:43:28 · 5068 阅读 · 0 评论 -
python爬取丁香园的疫情数据绘制Echarts地图
2020.2.4更新 完整的项目工程地址https://github.com/Arithmeticjia/wuhan 2020.1.26更新 几乎每天页面都在变,放一下最新的爬虫代码,由于页面需要滚动,加入了selenium def china_wuhan(request): import requests from bs4 import BeautifulSoup ...原创 2020-01-24 12:23:10 · 18324 阅读 · 8 评论 -
python3 urllib爬虫,你只需要看这一篇就够了
写在最前面:以下数据均脱敏 from urllib import request import requests import urllib if __name__ == "__main__": # 接口的url session_requests = requests.session() data = {'username': '11111111', 'passwor...原创 2018-10-26 12:05:30 · 14726 阅读 · 1 评论