前言
嗨嗨,大家好~
前段时间看小说看的上头,现在有点腻了,开始看漫画了
今天就来用Python采集一下漫画吧
就随便爬一个,大家搞清楚思路后,可以自己去采集自己喜欢看的漫画哦
知识点:
- 爬虫基本流程
- 保存海量漫画数据
- requests的使用
- base64解码
开发环境:
- 版 本:python 3.8
- 编辑器:pycharm
- requests: pip install requests
- parsel: pip install parsel
如何安装python第三方模块:
-
win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests)回车
-
在pycharm中点击Terminal(终端) 输入安装命令
实现代码:
- 发送请求
- 获取数据
- 解析数据
- 保存数据
代码
import base64
import requests
import re
import json
import parsel
import os
# 伪装
headers = {
# 用户信息
'cookie': '__AC__=1; tvf....

原码.点击即可领取 【备注:苏】
select = parse

本文介绍了如何使用Python进行漫画数据的采集,涵盖了爬虫基本流程、数据保存、requests库和base64解码等知识点。通过实例代码演示了发送请求、解析数据和保存漫画的过程。
最低0.47元/天 解锁文章

794

被折叠的 条评论
为什么被折叠?



