自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 调用MapReduce对文件中各个单词出现次数进行统计

调用MapReduce对文件中各个单词出现次数进行统计一、安装Linux二、准备工作2.1 创建Hadoop账户2.2 更新apt2.3 安装vim2.4 配置SSH三、安装Java3.1 安装JDK3.2 设置JAVA环境变量四、安装Hadoop4.1 配置环境变量和进行伪分布式操作4.2 格式化 NameNode4.3 开启NameNode和DataNode守护进程4.4 校验安装五、调用MapReduce执行WordCount对单词进行计数5.1 准备工作(确保安装好eclipse和下载好hadoop

2021-06-09 23:37:43 1965 3

原创 调用Spark对2020年美国新冠肺炎疫情数据分析

调用Spark对2020年美国新冠肺炎疫情数据分析一、实验环境1.Linux系统2.编程环境二、数据集2.1 数据集下载2.2 格式转换2.3 将文件上传至HDFS文件系统中三、使用Spark对数据进行分析3.1 完整代码3.2 读取文件生成DataFrame3.3 进行数据分析3.4 结果文件四、数据可视化4.1 可视化工具选择与代码4.2 结果图标展示五.总结六.参考资料(包含资源下载地址)本案例以2020年美国新冠肺炎疫情数据作为数据集,以Python为编程语言,使用Spark对数据进行分析,并对

2021-06-09 23:35:55 1847 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除