自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 B站点评数据的文本挖掘

B站点评数据的文本挖掘本次的挖掘思路借鉴了中国大学MOOC的《媒体大数据挖掘与案例实战》,感兴趣的朋友可以自行观看,话不多说直入主题,本文是我另一篇博客的后续。不清楚如何爬取B站数据的朋友可以看看我之前的博客:如何爬取B站数据话不多说直接上思路和代码。爬虫首先使用request库爬取点评和评分,原本打算继续对《异度侵入》进行挖掘的,但无奈该动漫在B站的宽松评分环境下平均分直接达到9.9...

2020-03-09 17:33:39 1001

原创 正则表达式基础

正则表达式基本用法正则表达式定义正则表达式常用操作符正则表达式功能函数re库的特殊数据类型match本文主要转载自中国大学mooc,感兴趣的小伙伴可以自行观看,身为一个编程小白,写本文仅仅为了加深印象:Python网络爬虫与信息提取正则表达式定义re是regular expression缩写,也可以写成regex,RE。正则表达式是用来间接表达一组字符串的表达式。其作用就是使用符号表示一类具...

2020-01-31 15:30:35 172

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除