
爬虫
文章平均质量分 64
跌倒在了学习的路上
萌新
展开
-
python爬取ajax案例 代码更新之 肯德基餐厅获取
针对肯德基餐厅修改了ajax请求小修代码网址代码如下思路讲解网址http://www.kfc.com.cn/kfccda/storelist/index.aspx代码如下#!/usr/bin/python3.8# -*- coding: UTF-8 -*-# @Time : 2021/9/23 8:34 # @Author : keke618# @File : get_kfc.py # @Software: PyCharmimport requestsimport pprint原创 2021-09-25 17:05:43 · 243 阅读 · 0 评论 -
bilibili专栏图片爬取(scrapy框架)
针对b站专栏图片爬取环境准备全部代码一、spiders下的example.py二、items.py三、pipelines.py四、settings.py环境准备你好!可能这是你第一次使用 scrapy框架 ,所以你需要去安装一下才能使用。接下来我将讲述如何在多个平台安装scrapy。windows系统 - pip install wheel ## 一定要先安装wheel - 下载twisted,下载地址为http://www.lfd.uci.edu/~gohlke/pythonlibs/#tw原创 2021-05-30 16:29:37 · 771 阅读 · 0 评论 -
python爬虫(二)过年过的都没更新 爬一个糗图百科热图吧
思路如下测试爬取网站一、判断图片url所在页面位置二、保存图片三、完整代码如下测试爬取网站https://www.qiushibaike.com/imgrank/page/爬取目标是糗图百科的热图一、判断图片url所在页面位置通过浏览器自带的f12 谷歌开发者工具查看网页代码找到图片url所在位置使用正则定位,代码如下def get_img_url(url): ret = requests.get(url=url,headers=headers).text #获取网页代码原创 2021-03-01 15:12:02 · 366 阅读 · 2 评论 -
python爬虫 萌新第一次试手
思路如下爬取测试网站获取该网站多个主页的url获取主页中相册首页url得到相册内所有img图片网址保存图片文件遍历执行爬取测试网站这个网站是百度搜的壁纸网站 练手用的 第一次用xpath可能不太熟练下面是网址http://www.win4000.com/meinvtag2_1.html获取该网站多个主页的urldef get_url_list(): #得到多个主页 li = []原创 2020-12-22 18:01:18 · 1257 阅读 · 12 评论