自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (1)
  • 收藏
  • 关注

原创 Spark SQL的使用

Spark SQL是Spark用来处理结构化数据的一个模块,它提供了2个编程抽象:DataFrame和DataSet,并且作为分布式SQL查询引擎的作用。它是将HiveSQL转换成MapReduce然后提交到集群上执行,大大简化了编写MapReduc的程序的复杂性,由于MapReduce这种计算模型执行效率比较慢。所以Spark SQL的应运而生,它是将Spark SQL转换成RDD,然后提交到集群执行,执行效率非常快!

2023-11-21 05:27:29 1818 1

原创 spark开发一个程序,模拟生成新能源汽车数据集(字段信息必须包含:车架号、车型、采集时间、车速、行驶里程、故障码列表)

【代码】spark开发一个程序,模拟生成新能源汽车数据集(字段信息必须包含:车架号、车型、采集时间、车速、行驶里程、故障码列表)

2023-11-21 00:12:42 386 1

原创 spark开发一个程序,模拟生成新能源汽车数据集(字段信息必须包含:车架号、车型、采集时间、车速、行驶里程、故障码列表)

spark开发一个程序,模拟生成新能源汽车数据集(字段信息必须包含:车架号、车型、采集时间、车速、行驶里程、故障码列表)

2023-11-19 21:42:05 269 1

原创 java设计并完成一个数据驱动的管理系统

java设计并完成一个数据驱动的管理系统,设计一个学生管理系统

2023-07-05 00:10:40 260 1

原创 java连接数据库实现基本的增删改查

idea使用Java语句连接MySQL数据库实现增删改查

2023-06-30 01:23:33 11680 2

原创 hadoop调用HDFS java api实现在HDFS上创建文件夹

HDFS文件系统JavaAPI接口HDFS是存取数据的分布式文件系统,HDFS文件操作常有两种方式,一种是命令行方式,即Hadoop提供了一套与Linux文件命令类似的命令行工具。另一种是JavaAPI,即利用Hadoop的Java库,采用编程的方式操作HDFS的文件。

2023-06-28 16:25:29 3451

原创 python数据可视化热度词云

爬取豆瓣电影top100的影片类型,使用jieba中文分词器分词后,做一个可视化图形——词云图

2023-06-13 23:36:22 955 1

原创 数据可视化矩形树图

矩形树图(Treemap)也叫矩形式树状结构图,它采用多组面积不等的矩形嵌套而成在一张图中,所有矩形的面积之和代表了总体数据。各个小矩形的面积表示每个子项的占比,矩形面积越大,表示子数据在整体中的占比越大矩形树图适合展现具有层级关系的数据,能够直观体现同级之间的比较(矩形树图使用不同颜色和大小的长方形来显示数据的层次结构)矩形树图的好处在于,相比起传统的树形结构图,矩形树图能更有效得利用空间,并且拥有展示占比的功能。矩形树图的缺点在于,当分类占比太小的时候文本会变得很难排布。

2023-06-13 16:10:59 901

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除