自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 使用 requests+lxml 库的 Python 爬虫实例(以爬取网页连载小说《撒野》为例)

需求目标介绍使用 requests 库与 lxml 库进行简单的网页数据爬取普通框架与爬虫实例,本文以爬取网页连载小说《撒野》为例~当然有很多小说基本都能找到现成的 .txt 或者 .mobi 文件,不过有些又是注册登录,又是关注公众号啥的,我干脆写几行代码自己爬下来,之后有需要略微改下网页链接就行,一劳永逸~哈哈哈哈requests+lxml 爬虫框架1、一般通过 requests 库的 get(url, headers = header) 方法获取 html 页面,可以根据状态码判断是否

2020-11-17 10:27:35 4502

原创 Python 边用边学

文章将会整理记录下我在用 Python 的过程中所遇到的一些知识和小问题,这样印象比较深刻,也方便自己回头看看不至于每次都去查同样的内容。

2020-02-22 22:41:33 372

原创 通过requests包爬虫response.text中文乱码

问题:今天在用requests包爬虫的时候输出response.text的时候中文乱码:解决办法:查看爬取网页源代码中的编码方式:在代码中加入response的编码方式即可。response = requests.get(url, headers = headers)response.encoding = 'gb2312'...

2019-09-26 11:18:42 4208

原创 win10+python3下Anaconda的安装及环境变量配置

conda:无法将“conda”项识别为cmdlet、函数、脚本文件或可运行程序的名称。请检查……

2017-11-03 16:41:36 117769 9

原创 python导入词云包失败:ImportError:cannot import name ‘WordCloud’的解决办法

python正常安装wordcloud包,但还是提示ImportError:cannot import name ‘WordCloud’的解决办法……

2017-11-02 16:51:29 13514

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除