自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 Hive环境配置——基于CentOS9Stream系统

我在配置环境时发现了一些环境配置的差异,CentOS9Stream上并不能按照完全相同的步骤来完成本地部署,也就是基于本地Mysql数据库的Hive部署方式。安装Mysql数据库,直接使用yum命令下载安装即可,好像是只能使用Mysql8.0,我安装Mysql5.7报了libexec.so6啥的错,网上搜了一些办法最终也没解决,所以最好直接用8.0吧。将Mysql的jdbc驱动拷贝到hive的lib目录下,因为我们下载的是Mysql8.0,所以驱动也要是8.0版本,不用具体到小版本。

2025-03-16 21:13:53 824

原创 Kafka实时数据发送器——基于Java代码

模拟数据发送到Kafka辅助实现流数据处理

2025-03-16 00:04:19 318

原创 全国职业院校技能大赛-大数据应用赛项-离线数据处理-备赛笔记04-2024省赛离线数据处理专项训练

若该条记录第一次进入数仓dwd层则dwd_insert_time、dwd_modify_time均存当前操作时间,并进行数据类型转换。若该数据在进入dwd层时发生了合并修改,则dwd_insert_time时间不变,dwd_modify_time存当前操作时间,其余列存最新的值。若该数据在进入dwd层时发生了合并修改,则dwd_insert_time时间不变,dwd_modify_time存当前操作时间,其余列存最新的值。作为增量字段,只将新增的数据抽入,字段名称、类型不变,同时添加。

2025-01-04 15:56:19 789

原创 全国职业院校技能大赛-大数据应用赛项-离线数据处理-备赛笔记03-数据抽取清洗与指标计算

5、 将ods库中orders表数据抽取到dwd库中fact_orders的分区表,分区字段为etldate且值与ods库的相对应表该值相等,并添加dwd_insert_user、dwd_insert_time、dwd_modify_user、dwd_modify_time四列,其中dwd_insert_user、dwd_modify_user均填写“user1”,dwd_insert_time、dwd_modify_time均填写操作时间,并进行数据类型转换。到Hive的dwd库中对应表中。

2024-12-16 19:21:01 1832

原创 全国职业院校技能大赛-大数据应用赛项-数据采集与实时计算-备赛笔记02-实时数据处理

以get key方式获取totalrefundordercount值,将结果截图粘贴至客户端桌面【Release\任务D提交结果.docx】中对应的任务序号下,需两次截图,第一次截图和第二次截图间隔1分钟以上,第一次截图放前面,第二次截图放后面;以get key方式获取totalprice值,将结果截图粘贴至客户端桌面【Release\任务D提交结果.docx】中对应的任务序号下,需两次截图,第一次截图和第二次截图间隔1分钟以上,第一次截图放前面,第二次截图放后面;编写Scala代码,使用Flink消费。

2024-12-15 10:07:14 1232

原创 全国职业院校技能大赛-大数据应用赛项-数据采集与实时计算-备赛笔记01-数据采集

使用redis cli以get key方式获取refundcountminute值,将结果截图粘贴至客户端桌面【Release\任务D提交结果.docx】中对应的任务序号下,需两次截图,第一次截图和第二次截图间隔1分钟以上,第一次截图放前面,第二次截图放后面;使用redis cli以get key方式获取cancelrate值,将结果截图粘贴至客户端桌面【Release\任务D提交结果.docx】中对应的任务序号下,需两次截图,第一次截图和第二次截图间隔1分钟以上,第一次截图放前面,第二次截图放后面。

2024-12-14 20:50:35 2192 11

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除