自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 【大数据之数据仓库】

Maxwell的工作原理是实时读取MySQL数据库的二进制日志(Binlog),从中获取变更数据,再将变更数据以JSON格式发送至Kafka等流处理平台。通常情况,业务表数据量比较大,优先考虑增量,数据量比较小,优先考虑全量;中的多个关键业务过程联合处理而构建的事实表,如交易流程中的下单、支付、发货、确认收货业务过程。(3)DWS层表名的命名规范为dws_数据域_统计粒度_业务过程_统计周期(1d/nd/td),就是每天都将业务数据库中的全部数据同步一份到数据仓库,这是保证两侧数据同步的最简单的方式。

2025-02-18 09:35:59 1489

原创 【大数据之Spark】

需要继承 Receiver,并实现 onStart、onStop 方法来自定义数据源采集。

2023-07-17 10:56:51 207

原创 【大数据之Kafka】

重写Partitioner。

2023-05-13 17:57:50 220

原创 【大数据之Hive】

创建数据库:CREATE DATABASE [COMMENTLOCATIONhdfs_path]WITH查询数据库:SHOW DATABASES [LIKE ‘identifier_with_wildcards’];like通配表达式说明:*表示任意个任意字符,|表示或的关系。修改数据库–修改dbproperties–修改location修改数据库location,不会改变当前已有表的路径信息,而只是改变后续创建的新表的默认的父目录。–修改owner user。

2023-05-13 17:57:28 1448

原创 【大数据之Zookeeper】

zookeeper相关 学习

2023-02-23 19:33:27 137

原创 【大数据之Hadoop3.x】

尚硅谷学习Hadoop的笔记

2023-02-20 15:17:57 1738

原创 【大数据之Linux】

Linux操作基本技能以及命令

2022-12-20 18:28:31 86

原创 【大数据之JavaSE】

个人学习过程记录

2022-08-12 22:41:52 229 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除