如何实现高容量大并发数据库服务 | 数据库分布式架构设计

最新推荐文章于 2024-04-16 04:10:30 发布

原创最新推荐文章于 2024-04-16 04:10:30 发布 · 99 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#中间件 #算法 #配置管理 #云计算 #Lotus

本文介绍了在云时代下，如何实现高容量大并发数据库服务的运维管理实践。主要内容包括为何需要进行分布式数据库架构改造，如何进行数据库拆分，以及水平拆分的难点与解决方案。

阅读原文请点击：[url]http://click.aliyun.com/m/23415/[/url]
摘要：袋鼠学院和优云、阿里云联合举办的沙龙结束之后，总是有小伙伴们来问PPT内容，想要进一步了解Topic内容。（哦，对了对了，竟然还有小伙伴专门冲着袋鼠云去听沙龙，感动cry~~）千呼万唤，忙成狗的袋鼠小妹终于把沙龙总结整理了出来(⊙o⊙) 本次沙龙的主题是“云时代下的运维管理实践”，受邀请的演讲嘉宾，花名宏翊（经常关注袋鼠云的同学，肯定已经对这个名字很熟悉了），是袋鼠云首席数据库架构师，袋鼠学院数据库讲师。

袋鼠学院和优云、阿里云联合举办的沙龙结束之后，总是有小伙伴们来问PPT内容，想要进一步了解Topic内容。（哦，对了对了，竟然还有小伙伴专门冲着袋鼠云去听沙龙，感动cry~~）

千呼万唤，忙成狗的袋鼠小妹终于把沙龙总结整理了出来(⊙o⊙)

本次沙龙的主题是“云时代下的运维管理实践”，受邀请的演讲嘉宾，花名宏翊（经常关注袋鼠云的同学，肯定已经对这个名字很熟悉了），是袋鼠云首席数据库架构师，袋鼠学院数据库讲师。

呼应沙龙运维实践的主题，结合自己的专长领域，宏翊主要是从数据库领域来谈云时代下的运维管理该如何做，主题为“如何实现高容量大并发数据库服务？之数据库分布式架构设计”。

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

为什么数据库需要做分布式架构设计？在对数据库进行拆分设计和实施时，会遇到哪些坑？又该如何避免踩坑？

袋鼠小妹结合宏翊的PPT和现场演讲，整理内容如下，希望和大家一起分享、探讨。

摘要

数据库拆分要根据业务现状、模式，选择合适的拆分方式，紧密结合业务及应用架构设计，谨慎拆分，防止过度设计。

正文

一为什么要做分布式数据库架构改造？

云计算大数据时代，传统的数据库架构已经无法支撑企业高容量的数据增长，满足高并发的业务需求。对企业数据库进行分布式架构设计，打破了数据库资源不够用的天花板的同时，还能根据企业业务发展状况，随时平滑扩容。

二分布式数据库架构改造，如何做？

数据库分布式改造要遵循“循序渐进”的拆分原则

拆分方式有垂直拆分和水平拆分两种，选择拆分方式要根据企业自身业务发展需要。

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

一般来说，是先做垂直拆分，再做水平拆分。

在单一数据节点无法满足业务和用户增长需求的情况下，需要做一个服务化，对业务进行垂直梳理，后面的数据节点可以放在不同的资源节点上，以提高数据服务的整体性能。

比如一个APP的业务数据，在业务初期阶段，是全部放在一个数据库节点中，在业务量和数据量快速增长的中期阶段，需要进行垂直梳理，根据业务逻辑，拆分成商品、交易、用户，并分别放在不同的数据库。

如果其中的一个服务已经拆的很细了，但还是有性能瓶颈，无法支撑我们的业务增长，数据库这块才需要再做水平拆分。

水平拆分就是将数据（比如图中APP的交易数据）拆成多片，放到不同的资源上，用一个集群来支撑更高的业务增长。

在拆分时，要谨慎，因为拆分会引入复杂性，能不做就不做，最优先是做业务和架构上的优化，最终才是做数据库拆分。

在拆分的过程中，不要做过度的设计，或者直接从初级跳到高级，这样做其实非常浪费资源，投入产出比也不好。

三水平拆分的难点及解决方案

对企业数据库进行分布式改造，需要理解客户的业务逻辑、丰富的拆分经验积累。尤其是水平拆分，有系统复杂度高、技术挑战性强、稳定性控制难、具有一定局限性四大难点。

针对这些问题，宏翊给我们提供了两种解决方案。

客户端实现数据路由

此方案不会引入额外的组件，架构上比较轻量，简单场景使用尚可，但稍复杂的场景会放大它的劣势，比如配置管理复杂等。

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

数据库中间件

中间件的使用最大限度地屏蔽了分布式数据库所引入的复杂性，极大降低了研发的门槛。最重要的是，有了数据库中间件，应用看到的还是单一的数据库。

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

四水平切分原理及设计原则

要对一个表做拆分，选择一个拆分字段，通过一个路由算法确定数据存放在哪个底层库。

比如下列数据选择MEMBE_ID作为拆分键，通过路由算法计算后得出’test1234‘相关的数据应该落在库1上，DRDS会把所有MEMBE_ID=‘test1234’相关的请求全都路由到库1。其他数据请求亦落到相应的底层库。

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

接下来，当数据已经放下去了，应该如何去查询、访问和变更？

比如要查询一条记录，member_id=‘test1234’

它怎么去执行的呢？

首先计算一个hash值，当值等于某一个值，它会知道这个数据存储在哪一个库上，所以会直接路由到底层这个库，从这个库查询，返回结果。

中间件扮演的就是这个路由和计算的角色，性能非常强大。拆分后，各底层数据库数据量比较小，查询返回比较快；二是可以支持更高的并发，整体并发基本等于两个底层数据库实例并发之和。
阅读原文请点击：[url]http://click.aliyun.com/m/23415/[/url]