
项目
LMRzero
一名热爱编程的小白,希望与大家一起学习进步
时间序列分类 / Spark / 实时计算
展开
-
大数据基础以及项目视频下载(Spark、Hadoop等),面试必要学习
本博客主要更新大数据相关的教学视频和相关项目实战视频,以便于帮助广大大数据学习者。原创 2020-04-21 21:43:35 · 6454 阅读 · 1 评论 -
基于Spark的热点网络小说分析(一)
在项目中,我们将利用Spark对阿里文学网站上的小说进行离线和在线分析。本文中用到的技术有Scrapy爬虫+ Kafka + MongoDB + Spark Streaming + Spark MLlib + Spark SQL.接下来我们将结合具体代码进行分析。1.获取数据在本项目中我们主要使用阿里文学上各种类型小说作为数据集来源。我们首先需要使用Scrapy对网站中的小说进行抓取,我们...原创 2019-06-16 23:06:58 · 6633 阅读 · 2 评论