
数仓
文章平均质量分 68
day_ue
这个作者很懒,什么都没留下…
展开
-
数据清洗工作
数据清洗是数据分析的重要步骤之一,通过处理和修正不符合预期、不完整或错误的数据来提高数据的质量和准确性。数据清洗包括数据去重、缺失值处理、异常值处理、格式转换等。数据清洗的基本流程包括数据预处理、数据去重、缺失值处理、异常值处理、数据格式转换、归一化和标准化、数据合并和切分等。数据清洗需要根据实际情况选择合适的方法和技术,避免对数据造成过度干扰,提高数据分析的可靠性和效率。原创 2023-07-13 15:09:42 · 369 阅读 · 0 评论 -
业务架构、数据架构、应用架构、技术架构对比
业务架构、数据架构、应用架构、技术架构区别对比转载 2023-02-01 18:37:04 · 9248 阅读 · 0 评论 -
数仓面试的常见问题
数据面试题总结近源层(ods)存放原始数据,直接加载原始日志、数据,数据保存原貌不做处理仓库整合层明细数据层(dwd)结构与粒度原始表保持一致,对ODS层数据进行清洗(去除空值、脏数据、超过极限范围的数据)服务数据层(dws)以DWD为基础,进行轻度汇总应用层(ads)以DWD为基础,进行轻度汇总1.2 风层的意义**空间换时间:**通过建设多层次的数据模型供用户使用,避免用户直接使用操作型数据,可以更高效的访问数据把复杂问题简原创 2021-10-10 09:43:48 · 1301 阅读 · 0 评论 -
数据仓库建设
数仓建设意义、分层、建设流程原创 2021-06-26 19:18:57 · 559 阅读 · 0 评论