- 博客(74)
- 资源 (1)
- 收藏
- 关注

原创 总数量超过五十个,史上最全的爬虫项目集合
五十三个爬虫项目集合,可以说是史上较大的一个爬虫项目集合,该项目集合可以让你由浅入深的学习爬虫,也可以学习借鉴他人完整的爬虫项目,一次吃个饱,收藏一下也不亏
2020-01-21 22:12:24
13382
4
原创 nginx: [emerg] host not found in upstream “xxx.nginx.com“ in xxx/conf/nginx.conf:xx
nginx: [emerg] host not found in upstream "xxx.nginx.com" in xxx/conf/nginx.conf:xx...
2020-12-12 23:02:49
1417
原创 执行git commit命令时提示"Please tell me who you are."
执行git commit命令时提示"Please tell me who you are."
2020-04-12 09:58:48
1565
原创 笔趣阁爬虫(2020重制版),贴心的操作,谁用谁知道
笔趣阁爬虫(2020重制版),谁用谁知道,人性化设置,多进程爬取小说内容,速度极快,体验感甚佳
2020-03-26 12:23:16
6657
15
原创 配置Spark后续操作,连接Hive
前文:Ubuntu14从安装虚拟机开始配置Spark环境一、Hadoop分布式实例./bin/hdfs dfs -mkdir -p /user/hadoop./bin/hdfs dfs -mkdir ./input./bin/hdfs dfs -put /home/hadoop/下载/*.txt input./bin/hdfs dfs -ls二、spark支持hive的版本问...
2020-03-24 10:02:45
873
原创 Scrapy爬取知乎Python专题精华,连答主头像都给爬下来,不放过一切
Scrapy爬取知乎Python专题精华,主要有两个知识点,1、Scrapy自带的图片管道爬取图片;2、Scrapy多个item分别使用不同的pipeline进行处理。
2020-03-18 19:57:25
1225
4
原创 安装git,解决"git 不是内部或外部命令,也不是可运行的程序"问题
安装git,解决"git 不是内部或外部命令,也不是可运行的程序"问题
2020-03-16 20:46:43
22891
10
原创 我安装pyecharts时的曲曲折折
安装pyecharts血泪史,让大家知道下我走过的坑,我三顾pyecharts而不得,望推广,少走冤枉路
2020-03-08 08:38:30
689
7
原创 Ubuntu14从安装虚拟机开始配置Spark环境,步骤十分详细,步步配图
本文集成了以下内容:1.ubuntu虚拟机的安装,以及更换虚拟机下载源的方法;2.配置Java环境,解决Xftp中文乱码的方法;3.配置scala环境;4.配置hadoop环境(伪分布式);5.配置spark环境(单机模式)。
2020-02-23 18:27:52
4413
1
原创 Anaconda3安装jieba分词和wordcloud词云组件(2020.2.6)
目录前言一、安装jieba分词库(一)第一步、下载安装包(二)第二步,运行setup.py二、安装wordcloud词云库(一)第一步、下载安装包(二)第二步、输入指令安装最后前言jieba是优秀的中文分词第三方库,安装后可以使用其来对中文文本进行分词。而wordcloud,见名知意“词云”,wordcloud是基于Python的词云生成类库,以词语为基本单位,更加直观艺术的展示文本。由wor...
2020-02-06 15:30:52
4401
原创 selenium.common.exceptions.WebDriverException,导入selenium时出现的webDriver问题
问题:selenium.common.exceptions.WebDriverException: Message: 'chromedriver' executable needs to be in PATH. Please see https://sites.google.com/a/chromium.org/chromedriver/home
2020-02-05 10:40:30
1525
1
原创 爬虫练习-爬取拉勾网招聘信息(2020.2.2)
应对AJAX动态加载,并应用表单的交互技术,爬取爬取拉勾网招聘信息,解析网页返回的json数据,并将爬取的数据存储于MongoDB数据库中。
2020-02-02 16:27:09
6283
14
原创 Can't connect to MySQL server on 'localhost' ([WinError 10061] 由于目标计算机积极拒绝,无法连接。)
Can't connect to MySQL server on 'localhost' ([WinError 10061] 由于目标计算机积极拒绝,无法连接。)
2020-01-15 12:42:56
12054
6
原创 Python package里的__init__.py的简析和用法说明
Python package里的__init__.py的简析和用法说明
2020-01-09 10:17:28
10305
3
原创 爬虫练习-爬取豆瓣网图书TOP250的数据
爬取豆瓣网图书TOP250的数据,书名、链接、作者、出版社、出版时间、价格、评分、评语,并将数据存储于CSV文件中
2020-01-07 10:00:48
13538
10
原创 基于SSM框架的web入门项目(八)终章·学习记录
配合哔哩哔哩视频学习https://www.bilibili.com/video/av46183146?p=1,终章
2020-01-05 08:49:54
244
原创 基于SSM框架的web入门项目(七)学习记录
配合哔哩哔哩视频学习https://www.bilibili.com/video/av46183146?p=1
2020-01-04 13:56:43
291
原创 基于SSM框架的web入门项目(六)学习记录
配合哔哩哔哩视频学习https://www.bilibili.com/video/av46183146?p=1
2020-01-04 13:06:46
211
原创 基于SSM框架的web入门项目(五)学习记录
配合哔哩哔哩视频学习https://www.bilibili.com/video/av46183146?p=1
2020-01-04 10:31:44
232
原创 基于SSM框架的web入门项目(四)学习记录
配合哔哩哔哩视频学习https://www.bilibili.com/video/av46183146?p=1
2020-01-04 09:56:57
241
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人