
数据实战
文章平均质量分 88
数据实战通常是指在真实的业务场景中,通过对数据的采集、清洗、分析、建模和应用,解决实际问题并创造价值的过程。它不仅仅是理论学习或工具使用,而是将数据相关技能应用于实际项目中,解决真实的业务挑战。
000X000
愿意放弃自由来换取保障的人,其最终既得不到自由,也得不到保障
展开
-
FlinkCDC 达梦数据库实时同步
FlinkCDC 达梦数据库基于日志解析的实时同步程序,支持JAVA程序和SQL。原创 2024-12-09 09:16:03 · 3208 阅读 · 43 评论 -
数据质量核心维度与检查项
数据质量核心维度与检查项原创 2024-11-25 09:31:21 · 978 阅读 · 0 评论 -
Apache Doris应用场景
Apache Doris应用场景原创 2024-11-25 08:56:59 · 1057 阅读 · 0 评论 -
开源进销存ERP系统
开源进销存ERP系统原创 2024-10-22 15:00:47 · 610 阅读 · 0 评论 -
纯Python构建的中后台管理系统
纯Python构建的中后台管理系统原创 2024-10-22 14:58:36 · 721 阅读 · 0 评论 -
基于Hive数据仓库的标签画像实战
基于Hive数据仓库的标签画像实战原创 2024-10-22 14:44:23 · 1083 阅读 · 0 评论 -
2024企业数据价值实现
2024企业数据价值实现原创 2024-10-22 14:19:25 · 1144 阅读 · 0 评论 -
2024终极 Nginx 配置指南
终极 Nginx 配置指南原创 2024-10-22 14:13:07 · 1042 阅读 · 0 评论 -
全面掌握Kafka核心中的核心
全面掌握Kafka核心中的核心原创 2024-10-22 11:59:26 · 637 阅读 · 0 评论 -
中台平台架构设计方案
中台平台架构设计方案原创 2024-10-22 11:47:24 · 1900 阅读 · 0 评论 -
解决方案撰写实战
解决方案撰写实战原创 2024-10-22 11:42:58 · 1454 阅读 · 0 评论 -
大数据之Spark submit参数
大数据之Spark submit参数原创 2024-09-12 11:21:48 · 808 阅读 · 0 评论 -
大数据之Spark Executor资源分配
大数据之Spark Executor资源分配原创 2024-09-12 11:16:00 · 663 阅读 · 0 评论 -
大数据之Spark 资源调度
大数据之Spark 资源调度原创 2024-09-12 10:55:49 · 838 阅读 · 0 评论 -
大数据之Spark RDD 持久化
大数据之Spark RDD 持久化原创 2024-09-12 10:49:24 · 1082 阅读 · 0 评论 -
大数据之Spark 进程模型与分布式计算
大数据之Spark 进程模型与分布式计算原创 2024-09-12 10:38:57 · 950 阅读 · 0 评论 -
大数据之Spark 数据依赖图DAG
大数据之Spark 数据依赖图DAG原创 2024-09-12 10:30:42 · 1044 阅读 · 0 评论 -
大数据之Spark RDD 编程模型
大数据之Spark RDD 编程模型原创 2024-09-12 10:20:49 · 1360 阅读 · 0 评论 -
大数据之Shuffle详解
大数据之Shuffle详解原创 2024-09-12 10:05:59 · 2305 阅读 · 0 评论 -
数据开发流程规范及数据监控
数据开发流程规范及数据监控原创 2024-08-20 17:15:47 · 1440 阅读 · 0 评论 -
驾驶舱数据指标体系和数据大屏设计V2.0
驾驶舱数据指标体系和数据大屏设计V2.0原创 2024-08-20 16:28:33 · 1618 阅读 · 0 评论 -
超全MySQL优化清单
超全MySQL优化清单原创 2024-08-20 16:23:05 · 1111 阅读 · 0 评论 -
标签画像-基于Hive数据仓库实战
标签画像-基于Hive数据仓库实战原创 2024-08-20 16:18:04 · 816 阅读 · 0 评论 -
大数据-预处理方法总结
大数据-预处理方法总结原创 2024-08-20 16:12:44 · 1342 阅读 · 0 评论 -
销售预测数据挖掘实战V2.0
销售预测数据挖掘实战V2.0原创 2024-08-20 16:06:14 · 806 阅读 · 0 评论 -
Spark核心知识要点(八)Shuffle配置调优
Spark核心知识要点(八)Shuffle配置调优原创 2024-07-25 10:44:22 · 1510 阅读 · 0 评论 -
Spark核心知识要点(七)程序开发调优
Spark核心知识要点(六)程序开发调优原创 2024-07-25 10:43:40 · 656 阅读 · 0 评论 -
Spark核心知识要点(六)资源配置调优
Spark核心知识要点(六)资源配置调优原创 2024-07-25 10:42:32 · 1239 阅读 · 0 评论 -
Spark核心知识要点(五)数据倾斜解决方案
Spark核心知识要点(五)数据倾斜解决方案原创 2024-07-25 10:41:03 · 775 阅读 · 0 评论 -
Spark核心知识要点(四)
Spark核心知识要点(四)原创 2024-07-25 10:39:47 · 618 阅读 · 0 评论 -
Spark核心知识要点(三)
Spark核心知识要点(三)原创 2024-07-25 10:39:07 · 1162 阅读 · 0 评论 -
Spark核心知识要点(二)
Spark核心知识要点(二)原创 2024-07-25 10:38:08 · 853 阅读 · 0 评论 -
Spark核心知识要点(一)
Spark核心知识要点(一)原创 2024-07-25 10:37:28 · 960 阅读 · 0 评论 -
2024构建数据安全体系
2024构建数据安全体系原创 2024-07-17 14:59:05 · 1419 阅读 · 0 评论 -
全数仓体系建设规范V4.0
全数仓体系建设规范V4.0原创 2024-06-06 09:21:21 · 820 阅读 · 0 评论 -
详解大厂实时数仓建设V4.0
1. 近实时的数据接入前面介绍了 Iceberg 既支持读写分离,又支持并发读、增量读、小文件合并,还可以支持秒级到分钟级的延迟,基于这些优势我们尝试采用 Iceberg 这些功能来构建基于 Flink 的实时全链路批流一体化的实时数仓架构。如下图所示,Iceberg 每次的 commit 操作,都是对数据的可见性的改变,比如说让数据从不可见变成可见,在这个过程中,就可以实现近实时的数据记录。2. 实时数仓 - 数据湖分析系统。原创 2024-06-06 09:14:35 · 1267 阅读 · 0 评论 -
Spark Core 企业级开发调优
Spark Core 企业级开发调优原创 2024-06-06 08:57:19 · 1107 阅读 · 0 评论 -
实时电商数仓建设V4.0
基于Lambda架构的实时电商数仓建设原创 2024-06-06 08:51:46 · 708 阅读 · 0 评论 -
解决Spark流处理产生的小文件问题
解决Spark流批产生的小文件问题原创 2024-06-06 08:47:41 · 1267 阅读 · 0 评论 -
Pycharm连接远程服务器 导入远程包时本地显示红色解决方法
使用pycharm工具 进行数据开发任务时,由于使用远程服务器进行开发的,代码在远程服务器上执行,导入远程服务器代码时,在本地数据脚本显示标准为红色,import XXX 显示红色问题。原创 2023-10-27 15:04:58 · 2704 阅读 · 6 评论