
大数据技能竞赛
文章平均质量分 58
xfcloud
大数据/数据处理/数据可视化,公众号:xfcloud
展开
-
搭建大数据技能竞赛比赛环境容器docker模块A-容器绑定物理网卡
编写Dockerfile基于cnetos7.9镜像搭建mysql5.7并初始化数据库和更改临时密码;物理网卡直接绑定容器,让容器与宿主机同一网段并且网络正常使用;搭建大数据技能竞赛模块A基础环境.原创 2025-03-10 08:00:00 · 964 阅读 · 0 评论 -
广东GZ033-任务E:数据可视化(15 分)-用柱状图展示销售金额最高的6 个月
编写Vue 工程代码, 读取虚拟机bigdata-spark 的/opt/data 目录下的 supermarket_visualization.csv,用柱状图展示2024 年销售金额最高的6 个月, 同时将用于图表展示的数据结构在vscode 终端中进行打印输出,将图表可视化 结果和vscode 终端打印结果分别截图并粘贴至物理机桌面【Release\任务E 提 交结果.docx】中对应的任务序号下。原创 2025-02-27 15:10:37 · 538 阅读 · 2 评论 -
Hadoop HA安装配置(容器环境),大数据职业技能竞赛模块A平台搭建,jdk+zookeeper+hadoop HA
(1) 所谓HA(High Availablity),即高可用(7*24小时不中断服务)。(2) 实现高可用最关键的策略是消除单点故障,HA严格来说应该分为各个组件的HA机制,HDFS的HA和YARN的HA。(3) NameNode主要在以下两个方面影响HDFS集群NameNode机器发生意外,如宕机,集群将无法使用,直到管理员重启NameNode机器需要升级,包括软件、硬件省级,此时集群也将无法使用。原创 2024-12-30 02:39:43 · 1664 阅读 · 0 评论 -
Hudi安装配置(容器环境)大数据技能竞赛平台搭建
hudi安装配置(容器环境)大数据技能竞赛模块A平台搭建,hudi与spark集成,数据胡安装配置原创 2024-12-27 08:00:00 · 2409 阅读 · 0 评论 -
Hive安装配置(容器环境)大数据职业技能竞赛
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。原创 2024-12-15 08:00:00 · 1151 阅读 · 2 评论 -
MySQL-5.7离线安装配置
因为在搭建hive和azkaban需要用到mysql数据库,所以先搭建好环境,练习自己搭建比赛会提供。原创 2024-12-14 18:21:13 · 1261 阅读 · 0 评论 -
Kafka安装配置(zookeeper+kafka)
kafka是最初由Linkedin公司开发,是一个分布式、支持分区的(partition)、多副本的(replica),基于zookeeper协调的分布式消息系统,它的最大的特性就是可以实时的处理大量数据以满足各种需求场景:比如基于hadoop的批处理系统、低延迟的实时系统、storm/Spark流式处理引擎,web/nginx日志、访问日志,消息服务等等,用scala语言编写,Linkedin于2010年贡献给了Apache基金会并成为顶级开源 项目。原创 2024-12-13 08:00:00 · 2545 阅读 · 0 评论 -
Spark on Yarn安装配置,大数据技能竞赛(容器环境)
Spark on Yarn模式,即把Spark作为一个客户端,将作业提交给Yarn服务,由于在生产环境中,很多时候都要与Hadoop使用同一个集群,因此采用Yarn来管理资源调度,可以有效提高资源利用率。服务端登录地址详见各任务服务端说明。补充说明:宿主机可通过Asbru工具或SSH客户端进行SSH访问;相关软件安装包在宿主机的/opt目录下,请选择对应的安装包进行安装,用不到的可忽略;所有任务中应用命令必须采用绝对路径;进入Master节点的方式为进入Slave1节点的方式为。原创 2024-12-05 20:58:22 · 2099 阅读 · 0 评论 -
2024世界职业技能大赛大数据平台搭建Flume安装配置(容器环境)
在容器中搭建大数据平台,搭建完hadoop后搭建flume,并采集hadoop的namenode的日志传输到hdfs系统中原创 2024-12-01 07:45:00 · 909 阅读 · 0 评论 -
2024大数据职业技能竞赛(国赛)模块E-工业 用折线图展示设备OP160每日的运行时长
编写Vue工程代码,根据接口,用折线图展示设备OP160每日的运行时长(秒),同时将用于图表展示 的数据结构在浏览器的console中进行打印输出, 将图表可视化结果和浏览器console打印结果分别截 图并粘贴至客户端桌面【Release\任务E提交结果.docx】中对应的任务序号下。原创 2024-11-22 08:00:00 · 317 阅读 · 0 评论 -
搭建大数据技能竞赛比赛环境容器docker模块A
搭建大数据技能竞赛比赛环境容器docker模块A原创 2024-11-18 18:28:47 · 870 阅读 · 0 评论 -
世界技能竞赛大数据应用开发环境1:1还原
世界职业院校技能竞赛,全国职业技能竞赛,大数据应用开发,国赛大数据,数据处理,数据可视化,大数据平台搭建。原创 2024-11-08 11:33:38 · 492 阅读 · 0 评论 -
2024大数据职业技能竞赛(国赛)模块E,子任务十一:用条形图展示平均消费额最高的地区
编写Vue工程代码,根据接口,用条形图展示2020年平均消费额(四舍五入保留两位小数)最高的5个地区,同时将用于图表展示的数据结构在浏览器的console中进行打印输出,将图表可视化结果和浏览器console打印结果分别截图并粘贴至客户端桌面【Release\任务E提交结果.docx】中对应的任务序号下。私聊博主获取全部数据。原创 2024-07-24 08:00:00 · 462 阅读 · 1 评论 -
2024大数据职业技能竞赛(国赛)模块E,子任务八:用条形图展示消费额最高的地区
编写Vue工程代码,根据接口,用条形图展示2020年消费额最高的5个地区,同时将用于图表展示的数据结构在浏览器的console中进行打印输出,将图表可视化结果和浏览器console打印结果分别截图并粘贴至客户端桌面【Release\任务E提交结果.docx】中对应的任务序号下。私聊博主获取全部数据。原创 2024-04-27 21:49:53 · 311 阅读 · 2 评论 -
2024大数据职业技能竞赛(国赛)模块E,子任务七:用饼状图展示各地区消费能力
编写Vue工程代码,根据接口,用饼状图展示2020年各地区的消费总额占比,同时将用于图表展示的数据结构在浏览器的console中进行打印输出,将图表可视化结果和浏览器console打印结果分别截图并粘贴至客户端桌面【Release\任务E提交结果.docx】中对应的任务序号下。私聊博主获取全部数据。原创 2024-04-23 12:36:10 · 452 阅读 · 1 评论 -
2024大数据职业技能竞赛(国赛)模块E,子任务一:用柱状图展示消费额最高的省份
编写Vue工程代码,根据接口,用柱状图展示2020年消费额最高的5个省份,同时将用于图表展示的数据结构在浏览器的console中进行打印输出,将图表可视化结果和浏览器console打印结果分别截图并粘贴至客户端桌面【Release\任务E提交结果.docx】中对应的任务序号下。原创 2024-03-22 15:10:32 · 851 阅读 · 2 评论 -
2024大数据职业技能竞赛(国赛)模块E,子任务四:用条形图展示平均消费额最高的省份
编写Vue工程代码,根据接口,用条形图展示2020年平均消费额(四舍五入保留两位小数)最高的5个省份,同时将用于图表展示的数据结构在浏览器的console中进行打印输出,将图表可视化结果和浏览器console打印结果分别截图并粘贴至客户端桌面【Release\任务E提交结果.docx】中对应的任务序号下。需要接口数据的可以私聊!原创 2024-03-27 22:04:11 · 651 阅读 · 0 评论 -
2024大数据职业技能竞赛(国赛)模块E,子任务五:用折柱混合图展示省份平均消费额和地区平均消费额
编写Vue工程代码,根据接口,用折柱混合图展示2020年各省份平均消费额(四舍五入保留两位小数)和地区平均消费额(四舍五入保留两位小数)的对比情况,柱状图展示平均消费额最高的5个省份,折线图展示这5个省所在的地区的平均消费额变化,同时将用于图表展示的数据结构在浏览器的console中进行打印输出,将图表可视化结果和浏览器console打印结果分别截图并粘贴至客户端桌面【Release\任务E提交结果.docx】中对应的任务序号下。原创 2024-04-14 01:46:24 · 727 阅读 · 1 评论 -
2024大数据职业技能竞赛(国赛)模块E,子任务六:用柱状图展示各地区消费额的中位数
编写Vue工程代码,根据接口,用柱状图展示2020年各地区所有订单消费额的中位数(降序排列,若有小数则四舍五入保留两位),同时将用于图表展示的数据结构在浏览器的console中进行打印输出,将图表可视化结果和浏览器console打印结果分别截图并粘贴至客户端桌面【Release\任务E提交结果.docx】中对应的任务序号下。私聊博主获取全部数据。原创 2024-04-20 18:38:32 · 655 阅读 · 1 评论 -
2024大数据职业技能竞赛(国赛)模块E,子任务二:用柱状图展示消费额最低的省份
编写Vue工程代码,根据接口,用柱状图展示2020年消费额最低的5个省份,同时将用于图表展示的数据结构在浏览器的console中进行打印输出,将图表可视化结果和浏览器console打印结果分别截图并粘贴至客户端桌面【Release\任务E提交结果.docx】中对应的任务序号下。2024大数据职业技能竞赛(国赛)模块E数据展现题解。原创 2024-03-24 13:02:48 · 486 阅读 · 1 评论 -
2023大数据技能竞赛模块B数据抽取Task1_4(工业)
使用hive cli执行show partitions ods.machinedata命令,将hive cli的执行结果截图粘贴至客户端桌面【Release\任务B提交结果.docx】中对应的任务序号下。编写Scala代码,使用Spark将MySQL库中表ChangeRecord,BaseMachine,MachineData, ProduceRecord全量抽取到Hive的ods库中对应表changerecord,basemachine, machinedata,producerecord中。原创 2024-01-19 22:21:03 · 510 阅读 · 1 评论 -
2023大数据技能竞赛模块B数据抽取Task1_2(工业)
使用hive cli执行show partitions ods.basemachine命令,将hive cli的执行结果截图粘贴至客户端桌面【Release\任务B提交结果.docx】中对应的任务序号下;编写Scala代码,使用Spark将MySQL库中表ChangeRecord,BaseMachine,MachineData, ProduceRecord全量抽取到Hive的ods库中对应表changerecord,basemachine, machinedata,producerecord中。原创 2024-01-19 22:17:50 · 451 阅读 · 1 评论 -
2023大数据技能竞赛模块B数据抽取Task1_1(工业)
使用hive cli执行show partitions ods.changerecord命令,将hive cli的执行结果截图粘贴至客户端桌面【Release\任务B提交结果.docx】中对应的任务序号下;编写Scala代码,使用Spark将MySQL库中表ChangeRecord,BaseMachine,MachineData, ProduceRecord全量抽取到Hive的ods库中对应表changerecord,basemachine, machinedata,producerecord中。原创 2024-01-19 22:15:50 · 646 阅读 · 1 评论 -
2024大数据职业技能竞赛(国赛)模块B数据处理题解
第一套各节点可通过Asbru工具或SSH客户端进行SSH访问;主节点MySQL数据库用户名/密码:root/123456(已配置远程连接);Hive的配置文件位于/opt/apache-hive-2.3.4-bin/conf/Spark任务在Yarn上用Client运行,方便观察日志。原创 2024-01-06 23:39:06 · 1412 阅读 · 1 评论 -
2023大数据技能竞赛模块B数据抽取Task1_6(电商)
编写Scala代码,使用Spark将MySQL的shtd_store库中表user_info、sku_info、base_province、base_region、order_info、order_detail的数据增量抽取到Hive的ods库中对应表user_info、sku_info、base_province、base_region、order_info、order_detail中。(若ods库中部分表没有数据,正常抽取即可)以上代码如有错误,请各位大佬指正。原创 2024-01-06 23:14:12 · 551 阅读 · 1 评论 -
2023大数据技能竞赛模块B数据抽取Task1_5(电商)
编写Scala代码,使用Spark将MySQL的shtd_store库中表user_info、sku_info、base_province、base_region、order_info、order_detail的数据增量抽取到Hive的ods库中对应表user_info、sku_info、base_province、base_region、order_info、order_detail中。(若ods库中部分表没有数据,正常抽取即可)以上代码如有错误,请各位大佬指正。原创 2024-01-06 23:11:14 · 458 阅读 · 1 评论 -
2023大数据技能竞赛模块B数据抽取Task1_4(电商)
抽取shtd_store库中base_region的增量数据进入Hive的ods库中表base_region。编写Scala代码,使用Spark将MySQL的shtd_store库中表user_info、sku_info、base_province、base_region、order_info、order_detail的数据增量抽取到Hive的ods库中对应表user_info、sku_info、base_province、base_region、order_info、order_detail中。原创 2024-01-06 23:09:00 · 437 阅读 · 3 评论 -
2023大数据技能竞赛模块B数据抽取Task1_3(电商)
抽取shtd_store库中base_province的增量数据进入Hive的ods库中表base_province。编写Scala代码,使用Spark将MySQL的shtd_store库中表user_info、sku_info、base_province、base_region、order_info、order_detail的数据增量抽取到Hive的ods库中对应表user_info、sku_info、base_province、base_region、order_info、order_detail中。原创 2024-01-06 23:04:51 · 657 阅读 · 0 评论 -
2023大数据技能竞赛模块B数据抽取Task1_2(电商)
抽取shtd_store库中sku_info的增量数据进入Hive的ods库中表sku_info。编写Scala代码,使用Spark将MySQL的shtd_store库中表user_info、sku_info、base_province、base_region、order_info、order_detail的数据增量抽取到Hive的ods库中对应表user_info、sku_info、base_province、base_region、order_info、order_detail中。原创 2024-01-03 14:08:29 · 591 阅读 · 0 评论 -
2023大数据技能竞赛模块B数据抽取Task1_1(电商)
编写Scala代码,使用Spark将MySQL的shtd_store库中表user_info、sku_info、base_province、base_region、order_info、order_detail的数据增量抽取到Hive的ods库中对应表user_info、sku_info、base_province、base_region、order_info、order_detail中。(若ods库中部分表没有数据,正常抽取即可)以上代码如有错误,请各位大佬指正。原创 2024-01-03 13:17:46 · 892 阅读 · 1 评论