自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 爬b站(bilibili)新电影《八佰》短评

爬b站(bilibili)新电影《八佰》短评关于我为什么要爬《八佰》短评这件事2020年11月,b站上映了《八佰》,有不少人去评分区评分和吐槽。该电影在一天之内分数从3.8分涨至5.5分,令人费解。看短评去大多都是1星,有人说是因为5星被人踩了所以排在后面,其实打五星的很多,只是没有人看见。所以我冒着电脑爆炸的风险去爬了这部电影的短评。(注:本代码完成与11月4日16时,当时只有1万7千左右的短评)需要用到的库有:requests、re、pandas、selenium、lxml。还要准备Chr

2020-11-05 21:10:09 906

原创 scrapy练习_爬“糗事百科”

scrapy练习_爬“糗事百科”scrapy是一个爬虫用的脚手架,和用于搭建网站的vue差不多。具体我也不知道有什么用(~ _ ~ ")。创建scrapy项目首先创一个新建文件夹,之后打开jupyter notebook,虽然可以不打开,直接使用cmd,但是cmd的界面真是不太容易看,而且很乱。在jupyter notebook界面中输入dir,确定我们进入了刚刚创建的文件夹中。输入 ! scrapy startproject qsbk创建名为qsbk的scrapy项目这样它就会为我们

2020-06-28 16:44:56 483

原创 丞相弩的pandas笔记实战篇——表格合并与分析

pandas表格合并先拿出几个表格df_rawdf_raw = pd.read_csv("fsnd_zb_data.tsv",encoding='utf8',sep='\t', keep_default_na=False,na_values='na_rep', index_col=[0,1,2])display(df_raw) data

2020-05-26 17:41:02 707

原创 丞相弩的pandas基础笔记

pandas笔记pandas数据分析pandas是Python的一个数据处理的模块,是一个表格处理器。用Python做数据分析,pandas是必不可少的。首先必须要导入这个pandas库:import pandas as pd之后我们就可以开始使用pandas了。首先我们要一个表格,表格的获取有三种办法,第一是用字典方法:第二是用爬虫来爬import requestsimport lxmlimport pandas as pdfrom lxml import etreeres

2020-05-24 00:28:31 773

原创 高德地图API全家桶python3

高德地图全家桶首先写下这几个标准操作import pandas as pd # 实用的制表标准库from pandas.io.json import json_normalize # 这个可以将json变成表格import requests # 网络爬虫标准配置key ="3f773d**********62d221d"获取地理编码def geocode(address,city...

2020-04-28 11:00:56 2190

原创 Education Pack申请与WordPress

Education Pack申请与WordPressEducation pack申请流程二、GitHub Pack中可以架wordpress网站的资源三、AWS educate、DigitalOcean与阿里云架wordpress架站对比三者均提供类似服务三者差异Education pack申请流程申请学生包URL:[https://education.github.com/pack](h...

2020-04-28 10:55:35 849

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除