
Hudi学习专栏
文章平均质量分 95
Hudi数据湖学习笔记
超哥--
遨游在0/1海洋中的苦逼大学生
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Hudi第四章:集成Hive
本来关于Flink还有一些内容,但剩下的我了解过之后,觉得并不是很常用,而且 比较杂,所以还是决定需要的时候再学习吧。hudi的内容暂时就到这里,学习的过程中觉得hudi的技术还不是很成熟,很多地方的依赖需要自己修改,所以这次就不再进行太深层次的学习了。原创 2023-10-17 11:10:17 · 599 阅读 · 0 评论 -
Hudi第三章:集成Flink
之前的两次博客学习了hudi和spark的集成,现在我们来学习hudi和flink的集成。flink第一次就先写到这里剩下的还要在写一次。原创 2023-10-09 16:50:17 · 473 阅读 · 0 评论 -
Hudi第二章:集成Spark(二)
这次我们将hudi集成Spark补充完整。课程后边其实还有一些调优的内容,想了想还是没有写下了,用的时候再说吧。原创 2023-10-01 15:02:13 · 882 阅读 · 0 评论 -
Hudi第二章:集成Spark
Hudi可以使用Spark作为搜索引擎。我们写博客记录一下,不知道一次能不能写完。这一次就写到这里,东西比较多,关于Spark的东西还要在写一次。原创 2023-09-30 15:08:47 · 1457 阅读 · 0 评论 -
Hudi第一章:编译安装
Apache Hudi(发音为“连帽衫”)是下一代流数据湖平台。Apache Hudi 将核心仓库和数据库功能直接引入数据湖。Hudi 提供表、事务、高效的更新插入/删除、高级索引、流式摄取服务、数据聚类/压缩优化、 和并发性,同时将数据保留为开源文件格式。Apache Hudi 不仅非常适合流式处理工作负载,而且还允许您创建高效的增量批处理管道。原创 2023-09-24 19:01:51 · 1471 阅读 · 0 评论