
数据库
文章平均质量分 96
元闰子
这个作者很懒,什么都没留下…
展开
-
深入理解 SQL 中的 Grouping Sets 语句
本文首先简单介绍 Grouping Sets 的用法,然后以 Spark SQL 作为切入点,深入解析 Grouping Sets 的实现机制原创 2022-07-03 14:29:12 · 5084 阅读 · 2 评论 -
从Hash索引到LSM树(二)
前言在上一篇文章《从Hash索引到LSM树(一)》中,我们通过append-only log的数据结构,实现了一个具备高写入性能的key-value数据库。append-only log之所以有很高的写入性能,主要得益于磁盘的顺序写入。这可能违反了我们对磁盘的认知,因为在我们的印象中,写磁盘总是很慢。其实不然,准确地说应该是随机写磁盘很慢,因为在写之前可能会进行多次寻址。如果只是顺序写磁盘,性能是非常的高,如下的一个ACM报告中显示,顺序写磁盘甚至比随机写内存的性能还要高!举个例子,Kafka是一个高原创 2020-07-28 00:14:20 · 388 阅读 · 3 评论 -
从Hash索引到LSM树(一)
前言数据库算是软件应用系统中最常用的一类组件了,不管是一个庞大而复杂的电商系统,还是一个简单的个人博客,多多少少都会用到数据库,或是存储海量的数据,或是存储简单的状态信息。一般地,我们都喜欢将数据库划分为关系型数据库和非关系型数据库(又称NoSQL数据库),前者的典型代表是MySQL数据库,后者的典型代表是HBase数据库。不管是关系型,还是非关系型,数据库都离不开两个最基本的功能:(1)数据存储;(2)数据查询。简单来说就是,当你把数据丢给数据库时,它能够保持下来,并在稍后你想获取的时候,把数据返回给你原创 2020-06-26 20:16:26 · 353 阅读 · 1 评论