自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 Flink学习笔记

Flink 笔记记录

2025-03-09 12:25:02 978

原创 02_数仓分层设计

一站制造:将整个公司所有数据统一化在数据仓库中存储准备,根据以后的需求,动态直接获取数据。:明细数据层:对ODS层的数据根据业务需求实现ETL以后的结果:ETL以后事务事实表。从上到下:在线教育:先明确需求和主题,然后基于主题的需求采集数据,处理数据。:数据集市:按照不同部门的数据需求,将暂时没有实际主题需求的数据存储。关联:将主题事实的表进行关联,所有与这个主题相关的字段合并到一张表。:基础数据层:类似于以前讲解的DWM,轻度聚合。:维度数据层:类似于以前讲解的DIM:存储。

2025-02-11 00:20:16 212

原创 01_加油站服务商数据运营管理平台

加油站服务商数据运营管理平台。

2025-02-10 14:38:13 329

原创 数据仓库工具箱阅读笔记

收集业务需求与数据实现协作维度建模研讨4步骤维度设计过程选择业务过程声明粒度确认维度确认事实业务过程:组织完成的操作型活动、获得订单、处理保险索赔、学生课程注册、每个月每个账单的快照。粒度:粒度用于确定某一事实表中的行表示什么描述环境的维度用于度量的事实星型模型与OLAP多维数据库方便地扩展到维度模型。

2025-01-10 13:00:00 1704

原创 创建流失预测模型

【代码】创建流失预测模型。

2025-01-09 20:00:00 236

原创 调用训练好的模型

调用训练完成的模型进行预测。

2025-01-09 19:30:00 289

原创 相关性分析-制作矩阵图

相关性分析-制作矩阵图。

2025-01-09 10:12:49 262

原创 描述性数据分析

【代码】描述性数据分析。

2025-01-08 14:27:36 174

原创 数据分析-数据准备

Python脚本加载数据到数据库。

2025-01-08 14:12:30 378

原创 指标异常排查

对于某一块业务来说,建立完数据指标体系,整体的业务就得到监 控。当数据发生异动时,通过数据指标体系拆解,能够快速定位问题。本节的重点有三个:第一,理解数据异动背后的业务意义,这是最重要 的;第二,出现数据异动后,应该如何快速定位问题;第三,从数据埋 点到数据指标体系再到数据异动分析的闭环思维体系。

2024-07-03 10:30:00 1136

原创 数据分析方法论

1.对比思维

2024-07-02 23:45:34 752

原创 构建指标体系

指标体系的功能大致有三点:1. 形成标准化的衡量指标,监控业务发展状况指标体系是一套固化下来的业务监控指标,可以长期监控业务的发 展趋势,评价业务的现状。2. 通过指标分级治理,快速定位业务问题,优化业务方向从上述的分析中,我们很容易发现中国人口结构上的问题,自然增 长率太低,如果这个问题不解决就意味着未来年轻人会越来越少,老年 人会越来越多。要分析这个问题,数据分析师就需要具体定位一下问 题,从而对症下药。3. 形成标准化体系,可减少重复工作,提高分析效率指标体系是数据结果体系化的展示。

2024-06-29 15:24:25 1172

原创 数据分析示例-App付费用户的数据标签体系的构建

标签查询是数据标签体系基本的应用场景,业务方可以通过用户标 签查询所需的用户群体,对不同类型的用户群体实现精细化运营。当然,对于用户的社会属性等标签信息往往是基于用户行为使用一定的 算法推断出来的,也有基于第三方数据获取的。无论是面对用户分群的分析需求,还是指标体系的搭建相关需求, 数据分析师基本都可以从数据标签体系底层表中直接取数,而不需要通 过SQL再写几十行代码对数据进行分箱(分类),进而生成相应的标 签,所以能够节省一定的时间成本,提升分析效率。完成数据标签的开发之后,就到了部署上线的环节。

2024-06-29 14:40:55 866

原创 数据指标体系

数据指标体系建设

2024-06-28 16:15:36 1439

原创 数据分析思维

一、数据思维。

2024-06-28 11:23:07 203

原创 shell常用命令

shell 常用命令积累。

2023-03-08 10:46:12 185

原创 spark 常见算子,worldCount

saprk core 常见算子练习。下面案例可供参考常见算子练习。

2022-10-27 17:42:10 889 1

原创 scala 练习记录

scala 基础语法。

2022-10-27 17:26:36 177

原创 spark Stream 连接 mysql 写入数据乱码

sapark strem 读取socket 数据保存到mysql。乱码问题

2022-10-27 17:05:21 936

原创 eclipse 执行mr程序异常

eclipse 执行mr程序异常项目场景:这里简述项目相关背景:windows10 连接远程hadoop 集群,执行mr程序,报错问题org.apache.hadoop.io.nativeio.NativeIO$Windows.createDirectoryWithMode0(Ljava/lang/String;I)V环境信息:win10+jdk8+hadoop27.74 cdh问题描述:log4j:WARN No appenders could be found for logger

2021-03-10 17:28:27 196

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除