
Distributed Database
文章平均质量分 90
熟悉分布式数据库的原理和实现
蓬莱道人
半路出家的研究僧
展开
-
BenchmarkSQL使用教程
Transaction Processing Performance Council (TPC) 事务处理性能委员会,是一家非盈利IT组织,他们的目的是定义数据库基准并且向产业界推广可验证的数据库性能测试。而TPC-C最后一个C代表的是压测模型的版本,在这之前还有TPC-A、TPC-B。A / B 两个版本模拟的是银行转账业务,相对业务模型比较简单。TPC-C自92年初发布,在过去20多年,不管是在业界还是学术界都是应用最为广泛的OLTP压测工具。原创 2024-12-21 16:46:43 · 1059 阅读 · 0 评论 -
分布式数据库难题(四):单机事务
首先,设想这样一个例子:你正在开发一个应用程序来帮助医生管理医院的轮班。通常,医院会安排多个医生值班,医生也可以申请调整班次,但是前提是确保至少一位医生还在该班次中值班。现在的情况是,Alic和Bob是两位值班医生,两人碰巧都身体不适,因而都决定请假,不幸的是,他们几乎同一时刻点击了调班按钮,如下图所示:每笔事务总是首先检查是否至少有两名医生目前在值班。如果是的话,则有一名医生可以安全离开。由于数据库正在使用快照隔离级别,两个检查都返回有两名医生,所以两个事务都安全地进入到下一阶段。原创 2022-09-18 15:58:10 · 914 阅读 · 0 评论 -
分布式数据库难题(三):数据一致性
一直以来,在“分布式系统”和“数据库”这两个学科中,一致性(Consistency)都是重要概念,但它表达的内容却并不相同。对于分布式系统而言,一致性是在探讨当系统内的一份逻辑数据存在多个物理的数据副本时,对其执行读写操作会产生什么样的结果,这也符合 CAP 理论对一致性的表述。而在数据库领域,“一致性”与事务密切相关,又进一步细化到 ACID 四个方面。其中,I 所代表的隔离性(Isolation),是“一致性”的核心内容,研究的就是如何协调事务之间的冲突。.........原创 2022-08-05 23:01:23 · 2306 阅读 · 0 评论 -
分布式数据库难题(二):数据复制
复制主要指通过互联网在多台机器上保存相同的数据副本,通过复制的方案,主要希望达成一下目的(1)使数据在地理位置上更接近用户,从而降低访问延迟;(2)当部分组件出现故障,系统依然可以继续工作,从而提高可用性;(3)扩展至多台机器以同时提供数据访问服务,从而提高读吞吐率;...原创 2022-08-01 22:48:51 · 538 阅读 · 0 评论 -
分布式数据库难题(一):数据分区
面对海量数据或者非常高的查询压力,我们需要将数据拆分成分区,采用分区的目的主要是提高可扩展性,将数据和查询负载均匀分布在所有节点上。如果节点平均分担负载,那么理论上10个节点应该能够处理10倍的数据量和10倍于单个节点的读写吞吐量。而如果分布不均匀,则会出现某些分区节点比其它分区承担更多的数据量或查询负载,称之为写倾斜。......原创 2022-07-30 21:36:32 · 825 阅读 · 1 评论