读数据工程之道:设计和构建健壮的数据系统34读后总结与感想兼导读

1. 基本信息

数据工程之道:设计和构建健壮的数据系统

  • [美]乔·里斯(Joe Reis),[美]马特·豪斯利(Matt Housley)著

  • 机械工业出版社,2024年2月出版

1.1. 读薄率

书籍总字数473千字,笔记总字数109584字。

读薄率109584÷473000≈23.17%

1.2. 读厚方向

  1. Data Mesh权威指南

  2. 数据的边界:隐私与个人数据保护

  3. 数据保护:工作负载的可恢复性

  4. 数据质量管理:数据可靠性与数据质量问题解决之道

  5. Julia数据科学应用

  6. MLOps权威指南

  7. 数据自助服务实践指南:数据开放与洞察提效

  8. 商战数据挖掘:你需要了解的数据科学与分析思维

  9. Spark快速大数据分析(第2版)

1.3. 笔记--章节对应关系

笔记章节字数发布日期
2024年
读数据工程之道:设计和构建健壮的数据系统01数据工程概述第1章 数据工程概述417010月7日
读数据工程之道:设计和构建健壮的数据系统02数据工程师第1章 数据工程概述509610月8日
读数据工程之道:设计和构建健壮的数据系统03数据工程生命周期(上)第2章 数据工程生命周期242310月9日
读数据工程之道:设计和构建健壮的数据系统04数据工程生命周期(下)第2章 数据工程生命周期396210月10日
读数据工程之道:设计和构建健壮的数据系统05底层设计(上)第2章 数据工程生命周期386710月11日
读数据工程之道:设计和构建健壮的数据系统06底层设计(下)第2章 数据工程生命周期292110月12日
读数据工程之道:设计和构建健壮的数据系统07数据架构的原则第3章 设计好的数据架构491510月13日
读数据工程之道:设计和构建健壮的数据系统08主要架构概念第3章 设计好的数据架构241010月14日
读数据工程之道:设计和构建健壮的数据系统09示例和类型第3章 设计好的数据架构259710月15日
读数据工程之道:设计和构建健壮的数据系统10技术选择第4章 根据数据生命周期选择技术304110月16日
读数据工程之道:设计和构建健壮的数据系统11云经济学第4章 根据数据生命周期选择技术347010月17日
读数据工程之道:设计和构建健壮的数据系统12开源软件第4章 根据数据生命周期选择技术305610月18日
读数据工程之道:设计和构建健壮的数据系统13无服务器第4章 根据数据生命周期选择技术251810月19日
读数据工程之道:设计和构建健壮的数据系统14源系统第5章 源系统中的数据生成303110月20日
读数据工程之道:设计和构建健壮的数据系统15源系统实际细节(上)第5章 源系统中的数据生成269710月21日
读数据工程之道:设计和构建健壮的数据系统16源系统实际细节(下)第5章 源系统中的数据生成310910月22日
读数据工程之道:设计和构建健壮的数据系统17存储的原材料第6章 存储376210月23日
读数据工程之道:设计和构建健壮的数据系统18数据存储系统(上)第6章 存储280610月24日
读数据工程之道:设计和构建健壮的数据系统19数据存储系统 (下)第6章 存储267410月25日
读数据工程之道:设计和构建健壮的数据系统20数据工程存储抽象第6章 存储398810月26日
读数据工程之道:设计和构建健壮的数据系统21数据获取第7章 获取266510月27日
读数据工程之道:设计和构建健壮的数据系统22获取阶段考虑因素第7章 获取277710月28日
读数据工程之道:设计和构建健壮的数据系统23批量获取的考虑因素第7章 获取226810月29日
读数据工程之道:设计和构建健壮的数据系统24获取数据的方式第7章 获取344610月30日
读数据工程之道:设计和构建健壮的数据系统25查询第8章 查询、建模和转换376711月2日
读数据工程之道:设计和构建健壮的数据系统26数据建模第8章 查询、建模和转换344811月3日
读数据工程之道:设计和构建健壮的数据系统27转换第8章 查询、建模和转换484211月4日
读数据工程之道:设计和构建健壮的数据系统28数据服务常见关注点第9章 为分析、机器学习和反向ETL提供数据服务271211月5日
读数据工程之道:设计和构建健壮的数据系统29分析第9章 为分析、机器学习和反向ETL提供数据服务411011月6日
读数据工程之道:设计和构建健壮的数据系统30机器学习第9章 为分析、机器学习和反向ETL提供数据服务384811月7日
读数据工程之道:设计和构建健壮的数据系统31安全和隐私第10章 安全和隐私390011月8日
读数据工程之道:设计和构建健壮的数据系统32序列化和云网络附录A 序列化和压缩技术的细节
附录B 云网络
234411月9日
读数据工程之道:设计和构建健壮的数据系统33未来第11章 数据工程的未来294411月10日
$总计109584$

2. 亮点

2.1 详述什么叫数据工程

  • 数据工程不同于软件工程

  • 有自己的特色、特点

2.2 流和批处理的比较

  • 批处理源远流长
  • 但是流技术的发展,渐渐有取代之势
  • 还有微批处理

2.3 数据分层和冷热

  • 根据数据冷热不同进行数据分层
  • 不同温度的数据处于不同的层次
  • 说到底,就是具体数据具体分析

2.4 数据工程师和其他角色的关系和区别

  • 描述了数据工程师的主要工程

  • 同时也指出了不同角色和数据工程师之间的关系和区别

    • 尤其是数据科学家和软件工程师

3. 感想

3.1 这个笔记好长啊

  • 如果没有记错的话,这个更新时长和字数,应该是除了学中项、高项之外的最多的笔记了

3.2 随着数据的不断增长,数据工程出现了

  • 事物的发展都是有一个过程的

  • 数据不到一定的级别,一定的量级,数据工程不会出现

  • 数据工程有自己的规律和规则,需要根据自身的情况实施

3.3 既要适应现实需求,又要有一定的前瞻性

  • 在进行数据工程时,既要根据该工程的实际情况选择合适的工具和架构以及系统构建

  • 同时,也要有一定的前瞻性,用于适应未来的变化

  • 但是,也不同太超前了,太超前了也往往意味着失败,过犹不及

3.4 好书,推荐阅读


评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值