目录
一、GaussDB 是什么
GaussDB 是华为基于 openGauss 自研生态推出的企业级分布式关系型数据库,凭借着强大的技术实力和卓越的性能,在数据库领域中崭露头角。它凝聚了华为在数据库领域 20 余年的战略投入,实现了软硬全栈协同创新研发 ,自诞生以来,便致力于为企业级用户提供稳定、高效、安全的数据管理解决方案。
GaussDB 具备一系列关键能力,使其在众多数据库产品中脱颖而出。它拥有高性能的分布式事务处理能力,能够应对高并发的业务场景。通过分布式并行执行框架和 GTM-Lite 技术,GaussDB 可以快速处理大量的事务请求,确保业务的流畅运行。在金融交易系统中,每秒钟可能会产生成千上万笔交易,GaussDB 能够迅速处理这些交易数据,保证交易的实时性和准确性。
高可靠性也是 GaussDB 的一大亮点。它支持同城容灾和跨地域容灾,能够确保在各种意外情况下数据的安全性和业务的连续性。例如,在同城容灾方案中,GaussDB 可以通过同城跨 AZ 双活方案,在同城的两个 AZ 中分别部署数据中心,实现关键系统的独立运行和实时数据同步。当主集群出现故障时,备集群可以迅速接管业务,保证业务连续运行,且数据一致性通过实时数据同步得以确保。
另外,GaussDB 还具备高安全性、弹性伸缩、一键部署、快速备份恢复、监控告警等关键能力。在数据安全方面,它采用了业界首个纯软全密态数据库技术,实现数据从传输、计算到存储的全程加密,有效保护企业数据资产。在弹性伸缩方面,GaussDB 支持 1000 + 计算节点在线扩展,能够根据业务需求灵活调整资源分配,满足企业业务快速发展的需求。
由于这些显著优势,GaussDB 在金融、电信、政企、能源、交通、互联网等各行业得到了广泛应用。在金融行业,它支撑着银行核心交易系统的稳定运行,如工商银行在信贷、贵金属交易等 30 余个系统中部署 GaussDB,支撑全球 7×24 小时服务,实现全栈自主创新与 RPO = 0(零数据丢失);邮储银行的新一代个人业务系统处理日均 20 亿笔交易,峰值达 6.7 万笔 / 秒,服务 6.5 亿客户,背后也离不开 GaussDB 的强大支撑。在电信领域,GaussDB 可以处理 PB 级话单数据,满足亿级话单的实时检索需求,通过内存分析技术提升响应速度,为电信运营商的业务运营提供有力保障。
二、为什么选择 GaussDB
(一)强大的技术特性
GaussDB 拥有一系列令人瞩目的技术特性,使其在数据库领域中脱颖而出。它采用了全并行分布式架构,基于 MPP(Massively Parallel Processing)架构的分布式并行执行架构,能够充分利用集群硬件资源,提高数据库并发能力和查询性能。在处理复杂查询时,GaussDB 可以将任务分解为多个子任务,并行地在多个节点上执行,大大缩短了查询时间。这种架构还具备强大的横向扩展能力,支持 1000 + 计算节点在线扩展,企业可以根据业务发展的需求,灵活地增加计算节点,以应对不断增长的数据量和业务负载。
高可用性是 GaussDB 的又一核心优势。它提供了同城跨 AZ、两地三中心、数据 0 丢失等多种高可用方案,全方位满足金融级监管要求。以两地三中心方案为例,GaussDB 通过在两个不同的地理位置建立三个数据中心,实现数据的实时同步和备份。当其中一个数据中心出现故障时,其他数据中心可以迅速接管业务,确保业务的连续性和数据的完整性。这种高可用方案不仅适用于金融行业,对于对业务连续性要求极高的政企、能源等行业同样具有重要意义。
在数据安全方面,GaussDB 表现出色,实现了数据从传输、计算到存储的全流程加密,保护数据全生命周期安全,并通过数据库领域国际 CC EAL4 + 认证,这是当前国内数据库在该领域获得的最高级别认证,意味着其在安全上已全面超越国外主流数据库产品。在数据传输过程中,GaussDB 采用 SSL/TLS 加密协议,确保数据在网络中传输的安全性;在计算阶段,利用密态计算技术,对数据进行加密计算,防止数据在计算过程中被窃取或篡改;在存储环节,通过 TDE(透明数据加密)技术,对存储在磁盘上的数据进行加密,即使磁盘丢失或被盗,数据也不会泄露。
此外,GaussDB 还具备优秀的事务一致性和数据完整性保证能力,能够确保在高并发环境下,数据的操作符合事务的 ACID 特性。在电商的订单处理系统中,当用户下单、支付、库存扣减等一系列操作作为一个事务执行时,GaussDB 能够保证这些操作要么全部成功,要么全部失败,不会出现部分操作成功、部分操作失败的情况,从而保证了数据的一致性和完整性。其智能优化器能够根据查询语句和数据分布情况,自动生成最优的执行计划,进一步提升查询性能。
(二)应用案例展示
GaussDB 在多个行业的成功应用案例,充分证明了其强大的实力和广泛的适用性。在金融领域,工商银行与华为云 GaussDB 的合作堪称典范。工商银行采用 GaussDB 对传统集中式数据库进行转型,在信贷、贵金属交易等 30 余个系统中部署 GaussDB,支撑全球 7×24 小时服务,实现全栈自主创新与 RPO = 0(零数据丢失)。通过与 GaussDB 的联合创新,工商银行成功解决了传统数据库在性能、扩展性和高可用性方面的瓶颈,提升了业务处理效率和系统的稳定性,为全球客户提供更加可靠的金融服务。
在车联网领域,随着汽车智能化和网联化的发展,车联网产生了海量的时序数据,对数据库的处理能力提出了巨大挑战。华为云 GaussDB (for Influx) 采用业界领先的计算存储分离架构,适用于海量数据场景下对系统有极致高可用、高扩展要求的业务。某知名车企使用 GaussDB (for Influx) 构建车联网数据库,满足了实时和历史车况查询能力。相比传统大数据方案,吞吐量提升 10 倍以上,计算资源节省 70%,存储资源节省 10 倍;单车时间范围查询秒级返回,单车最新值查询毫秒级返回,查询性能满足业务实时要求。这使得车企能够更好地利用车联网数据,为用户提供更优质的服务,如实时的车辆健康监测、智能驾驶辅助等。
在政企行业,数据库的安全性和稳定性至关重要。某省政府部门选用 GaussDB 构建政务数据平台,实现了政务数据的集中管理和高效共享。GaussDB 的高安全性保障了政务数据的安全存储和传输,防止数据泄露和篡改;其高可用性确保了政务系统的稳定运行,即使在面对突发情况时,也能保证政务服务的正常开展。通过使用 GaussDB,该省政府部门提高了政务工作效率,提升了公共服务水平,为智慧城市的建设提供了有力支持。
电商行业的业务特点是高并发和海量数据处理。某大型电商企业在促销活动期间,订单量和访问量会瞬间激增,对数据库的性能是巨大考验。该企业采用 GaussDB 作为核心数据库,利用其高性能的分布式事务处理能力和弹性伸缩特性,成功应对了促销活动的高并发压力。GaussDB 能够快速处理大量的订单数据,保证订单的及时处理和库存的准确更新;在活动结束后,又可以根据业务量的下降,自动缩减资源,降低成本。这使得电商企业在保障用户体验的同时,实现了资源的优化利用。
能源行业的数据管理也面临着诸多挑战,如数据量大、实时性要求高、数据安全重要等。某能源公司使用 GaussDB 搭建能源数据管理系统,实现了对能源生产、传输、分配等环节数据的实时采集、存储和分析。GaussDB 的 PB 级数据处理能力能够轻松应对能源公司海量的数据存储需求,其快速的查询响应能力为能源公司的生产决策提供了及时的数据支持。通过对能源数据的深入分析,能源公司可以优化生产流程,提高能源利用效率,降低生产成本。
电信行业同样是 GaussDB 的重要应用领域。某电信运营商采用 GaussDB 处理 PB 级话单数据,满足亿级话单的实时检索需求。通过内存分析技术,GaussDB 大大提升了话单数据的查询响应速度,为电信运营商的客户服务和业务运营提供了有力保障。电信运营商可以根据话单数据,为客户提供更加精准的服务套餐推荐,提升客户满意度;同时,也可以通过对话单数据的分析,优化网络资源配置,提高网络运营效率。
三、GaussDB 学习准备
(一)系统环境要求
在开始安装 GaussDB 之前,我们首先需要确保系统环境满足其运行要求,这样才能保证数据库的正常安装和稳定运行。下面为你详细介绍安装 GaussDB 所需的系统环境:
- 操作系统:GaussDB 支持多种操作系统,如常见的 Ubuntu、CentOS 等 Linux 发行版,以及 Windows Server 操作系统 。不同版本的操作系统对 GaussDB 的支持可能略有差异,在安装前请务必查看 GaussDB 官方文档,确认你所使用的操作系统版本是否在支持列表中。例如,Ubuntu 20.04 及以上版本、CentOS 8 及以上版本通常能很好地兼容 GaussDB。
- 硬件配置:为了保证 GaussDB 的性能,硬件配置方面至少需要 2 核 CPU,4GB RAM 及以上的内存,并且至少要有 20GB 的可用磁盘空间。如果你的业务数据量较大,或者对数据库性能要求较高,建议适当提高硬件配置。比如,使用 8 核 CPU、16GB 内存以及更大容量的磁盘,这样可以更好地应对高并发和大数据量的处理需求。
- 用户权限:在安装和操作 GaussDB 时,应至少具有一个非 root 的系统用户。使用非 root 用户进行操作可以提高系统的安全性,避免因误操作导致系统故障。你可以在操作系统中创建一个专门用于安装和管理 GaussDB 的用户,并赋予其适当的权限。
- 网络配置:系统需要具有静态 IP 地址,以便其他设备能够稳定地访问 GaussDB。同时,要确保开放数据库使用所需的端口,例如默认的 TCP 5432 端口。如果该端口被占用,你可以在安装过程中修改为其他未被占用的端口,但需要注意在后续访问时使用修改后的端口。另外,为了保证数据传输的稳定性,建议网络带宽不低于 100Mbps ,对于数据量较大的应用场景,最好使用千兆网络。
你可以通过以下命令检查系统环境是否满足要求:
# 查看操作系统信息
cat /etc/os-release
# 检查CPU信息
cat /proc/cpuinfo | grep "model name"
# 检查内存大小
free -m
# 检查磁盘空间
df -h
(二)安装包获取
当你的系统环境满足要求后,接下来就可以获取 GaussDB 的安装包了。获取安装包的途径主要有两种:
- 官方网站下载:访问 GaussDB 官方网站(https://www.huaweicloud.com/product/gaussdb.html ),在产品页面中找到下载区域。根据你的操作系统类型(如 Linux 或 Windows),选择对应的安装包版本进行下载。在下载页面,通常会提供不同版本的 GaussDB 安装包,以及详细的版本说明和更新日志,你可以根据自己的需求选择合适的版本。例如,如果你需要使用最新的功能和修复的漏洞,可以选择最新版本;如果你的系统对稳定性要求较高,且当前业务对新功能需求不大,也可以选择较为稳定的旧版本。
- 软件仓库获取:对于一些 Linux 发行版,如 Ubuntu 和 CentOS,GaussDB 可能已经被收录到官方软件仓库或第三方软件仓库中。你可以通过包管理工具(如 apt-get 或 yum)从软件仓库中直接下载安装包。以 Ubuntu 为例,使用以下命令更新软件包列表并安装 GaussDB: