- 博客(14)
- 资源 (2)
- 收藏
- 关注
原创 spark入门
PySpark入门1.Spark介绍1.1spark的应用及使用1.2Spark的计算流程设计二级目录二级目录二级目录二级目录二级目录二级目录二级目录二级目录二级目录二级目录二级目录二级目录二级目录二级目录三级目录1.Spark介绍Spark官网:https://spark.apache.org/定义:基于内存式计算的分布式统一化的数据分析引擎功能:数据分析引擎工具栈实现离线数据批处理,类似于MapReduce,写代码做处理实现交互式即时数据查询:类似于Hive、Presto、Impala,使
2022-06-07 22:08:21
1329
原创 新零售数仓DM层实现操作
新零售数仓DM层实现操作1.按周统计2.按月统计3.按年来统计4.商品主题统计宽表5.RPT层实现6.数据导出操作7.使用presto完成数据导出8.展示1.按周统计insert into xxxx.dm_sale with dim_date as ( select date_code, year_code, year_month, month_code , day_month_num , dim_date_id , year_week_name_cn from h
2022-05-26 19:01:04
648
原创 数仓之新零售项目
新零售项目1.新零售概述1.1行业背景1.2业务模块介绍1.3clouderamanager工具介绍1.4项目环境部署操作1.5数据仓库的基本概念2.维度分析2.1维度分析的基本介绍3.数仓建模3.1数仓建模概念3.2常见的数仓建模理论3.3事实表3.4维度表3.5数仓发展模型3.6缓慢渐变维3.7数仓分层介绍4.数仓工具的基本使用4.1使用 HUE 操作 oozie4.2如何使用oozie4.3sqoop的基本使用操作4.3.1sqoop的概述4.3.2基本操作4.3.3数据全量导入操作4.3.4数据条件
2022-05-11 00:54:31
2926
3
原创 MySQL练习题
MySQL50道练习题建表及数据1.查询" 01 "课程比" 02 "课程成绩高的学生的信息及课程分数1.1 查询同时存在" 01 "课程和" 02 "课程的情况1.2 查询存在" 01 "课程但可能不存在" 02 "课程的情况(不存在时显示为 null )1.3 查询不存在" 01 "课程但存在" 02 "课程的情况2.查询平均成绩大于等于 60 分的同学的学生编号和学生姓名和平均成绩3.查询在 SC 表存在成绩的学生信息4.查询所有同学的学生编号、学生姓名、选课总数、所有课程的成绩总和4.1显示没选课的
2022-04-10 22:52:16
251
原创 Python实现基础算法
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mar
2022-03-25 18:56:06
1362
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人