数据库
文章平均质量分 96
元闰子
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
对 Agent-First 数据库的畅想
在《AI Agent 需要什么样的数据库?负载特征能力要求即时创建极短的冷启动时长,提供极佳的用户体验。大量小实例 / 活跃时长不稳定自动弹性伸缩,降低平台成本。反复调试快速 PITR,提供任意时间点的快速数据恢复能力。其中,即时创建、大量小实例、活跃时长不稳定更多的是数据库实例生命周期维度的负载特征。至于 Agent 使用 SQL 查询的特征是怎样的,文中没做太多分析。反复调试与 SQL 查询相关,但文中并没有做定量分析,仍无法回答以下问题:“Agent 需要反复调试多少次才能成功?原创 2025-09-27 09:50:37 · 727 阅读 · 0 评论 -
深入理解 SQL 中的 Grouping Sets 语句
本文首先简单介绍 Grouping Sets 的用法,然后以 Spark SQL 作为切入点,深入解析 Grouping Sets 的实现机制原创 2022-07-03 14:29:12 · 5678 阅读 · 2 评论 -
从Hash索引到LSM树(二)
前言在上一篇文章《从Hash索引到LSM树(一)》中,我们通过append-only log的数据结构,实现了一个具备高写入性能的key-value数据库。append-only log之所以有很高的写入性能,主要得益于磁盘的顺序写入。这可能违反了我们对磁盘的认知,因为在我们的印象中,写磁盘总是很慢。其实不然,准确地说应该是随机写磁盘很慢,因为在写之前可能会进行多次寻址。如果只是顺序写磁盘,性能是非常的高,如下的一个ACM报告中显示,顺序写磁盘甚至比随机写内存的性能还要高!举个例子,Kafka是一个高原创 2020-07-28 00:14:20 · 434 阅读 · 3 评论 -
从Hash索引到LSM树(一)
前言数据库算是软件应用系统中最常用的一类组件了,不管是一个庞大而复杂的电商系统,还是一个简单的个人博客,多多少少都会用到数据库,或是存储海量的数据,或是存储简单的状态信息。一般地,我们都喜欢将数据库划分为关系型数据库和非关系型数据库(又称NoSQL数据库),前者的典型代表是MySQL数据库,后者的典型代表是HBase数据库。不管是关系型,还是非关系型,数据库都离不开两个最基本的功能:(1)数据存储;(2)数据查询。简单来说就是,当你把数据丢给数据库时,它能够保持下来,并在稍后你想获取的时候,把数据返回给你原创 2020-06-26 20:16:26 · 376 阅读 · 1 评论
分享