
Data Lake
文章平均质量分 75
cdai
这个作者很懒,什么都没留下…
展开
-
Data Lake学习资料推荐
Data Lake学习资料推荐整体介绍和产品《Lakehouse: A New Generation of Open Platforms that Unify Data Warehousing and Advanced Analytics》《The Snowflake Elastic Data Warehouse》数据存储:表、文件列存《Delta Lake: High-Performance ACID Table Storage over Cloud Object Stor原创 2022-03-01 04:02:14 · 568 阅读 · 0 评论 -
Hyperspace初体验:Delta Lake表索引
Hyperspace初体验:Delta Lake表索引1.简介Hyperspace是一个由微软开发的开源的数据湖索引子系统。1.1 特性提供了一套定义完好的索引管理API (4.1 建索引, 5.2 增量刷新)为用户提供更大的自由度,毕竟用户是最了解自己用例的人不尝试去解决所有问题,有些问题没有固定答案独立于数据和元数据,索引有自己的元数据/日志(4.2 Hyperspace日志)能感知到底层数据的版本,同数据一起“时间旅行” (5.1 Time Travel支持)因为原创 2021-12-22 03:43:03 · 1119 阅读 · 0 评论