
数据库
文章平均质量分 89
以数据库相关知识点为主
Hello.Reader
so far away
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
redis-py 在 Python 中连接与使用 Redis
Redis 是一个开源的高性能键值数据库,redis-py 则是官方推荐的 Python 客户端。本指南介绍如何安装 redis-py、连接到 Redis 服务器、执行常见读写操作,以及获取更多进阶使用资源。原创 2025-05-28 10:58:56 · 519 阅读 · 0 评论 -
Redis C语言连接教程
在现代 C 应用中,Redis 常被用作高性能的内存型键值存储。**hiredis** 是官方提供的 C 语言客户端库,拥有简洁的同步 API,便于嵌入各种项目。本文将从源码编译、安装、建立连接、发送命令、处理回复,到使用管道、事务及与事件驱动框架集成,带你快速上手 hiredis。原创 2025-05-27 13:39:16 · 570 阅读 · 0 评论 -
Go 应用中的 Redis 连接与操作
在现代 Go 应用中,Redis 已成为最流行的内存型 KV 存储之一。通过 go-redis 客户端,你可以在几行代码内完成与 Redis 的高效交互。本文将带你快速上手 go-redis,从安装、连接、简单读写,到结构体扫描、OpenTelemetry 监控,以及生产环境最佳实践,让你的 Go 服务对 Redis 的使用既健壮又可观测。原创 2025-05-27 11:54:02 · 1055 阅读 · 0 评论 -
使用 Redis 作为向量数据库
在现代应用中,我们常常需要处理大量的非结构化数据,如文本、图像、音频和视频。将这些数据存储并检索的传统方式(基于关键字或正则表达式)往往难以捕捉语义信息,而向量数据库(Vector Database)通过“语义向量”表示和检索这类数据,为各类智能应用提供了更丰富的检索能力。本文将基于 Redis 向量数据库(Redis Vector Search,简称 RedisVS 或 RedisVL)快速入门指南,带你从零开始了解并实操 Redis 作为向量数据库的全过程。原创 2025-05-27 11:23:35 · 931 阅读 · 0 评论 -
在 Windows 环境下高效导出 PostgreSQL 数据的最佳实践
无论是数据库迁移、备份容灾,还是数据分析前的预处理,PostgreSQL 的数据导出都是 DBA 和开发者经常要面对的任务。本文结合多种常见场景,从命令行到图形化工具,全方位介绍在 Windows 平台上导出 PostgreSQL 数据的实战方案与注意事项,帮助你快速上手并在生产环境中稳定应用。原创 2025-04-23 07:00:00 · 1144 阅读 · 0 评论 -
MyBatis 性能优化
通过前文的分析和优化技巧,我们深入探讨了 MyBatis 多表关联和动态 SQL 的常见性能陷阱以及优化方法。在本节中,我们将回顾性能优化的关键点,并梳理在实际项目中应用这些优化时需要注意的事项。6.1 性能优化的关键点回顾SQL 的合理设计降低多表关联的复杂度,尽可能减少不必要的关联。将复杂的查询拆分为多个简单的查询步骤,在应用层进行数据整合。高效的分页处理使用LIMIT和OFFSET实现分页,避免一次性返回大数据量。在大数据场景中优先使用主键或游标分页以提高效率。索引优化。原创 2025-01-10 23:32:00 · 1335 阅读 · 0 评论 -
深入解析 Redis
例如,将用户的所有信息(如地址、昵称、订单等)都存储在一个大型哈希表中,当查询某些小部分数据时,Redis 需要载入整个哈希表并遍历其中的数据,导致不必要的内存读取和 CPU 计算。特别是对于高并发环境,键设计不当或者不合理的数据过期策略会导致大量的内存占用、频繁的垃圾回收、缓存穿透等问题,从而影响 Redis 的整体性能。在 Redis 中,数据是存储在内存中的,因此内存的管理直接影响到 Redis 的性能。Redis 在处理数据时,对于小对象的频繁写入会产生较大的性能开销,尤其是在高并发场景下。原创 2024-12-07 21:57:05 · 1184 阅读 · 0 评论 -
利用 Redisson 实现分布式主键生成
分布式主键是一种能够在分布式环境中生成全局唯一标识符(ID)的机制,常用于数据库的主键或分布式存储的对象标识。原创 2024-12-01 09:30:00 · 1167 阅读 · 0 评论 -
数据分库分表 - 2N 法分表全解析与实战指南
随着现代业务系统数据量的不断增长,单表数据存储和查询的性能瓶颈逐渐显现,分库分表成为应对这一挑战的重要策略。2N 法分表是一种基于渐进式扩展的分表方法,通过按需拆分表的方式动态调整存储和计算资源,解决单表性能问题,同时避免一次性设计大量表的复杂性。原创 2024-11-28 14:06:22 · 1360 阅读 · 0 评论 -
MySQL性能优化页分裂与页合并原理
9.1总结在MySQL性能优化中,页分裂与页合并是两种常见但容易被忽视的现象。它们分别在数据写入和删除操作中起到动态调整存储结构的作用,但也可能带来显著的性能开销。通过深入理解其原理、触发条件以及对性能的影响,我们可以更好地针对性优化数据库设计和操作模式。核心要点总结。原创 2024-11-26 09:00:00 · 1499 阅读 · 0 评论 -
深入解析MySQL日志四剑客:Undo Log、Redo Log、Bin Log与Relay Log
MySQL日志体系由Undo LogRedo LogBin Log和Relay LogUndo Log:记录数据的原始值,用于事务回滚和多版本并发控制(MVCC),支持事务隔离性和一致性。Redo Log:记录物理变更,用于数据持久化和崩溃恢复,保证了事务的持久性。Bin Log:记录逻辑变更,用于数据恢复、主从复制和数据审计,支持数据一致性和备份恢复。Relay Log:从库生成的本地日志,用于主从复制,提升了分布式架构下的高可用性。原创 2024-11-25 09:00:00 · 1053 阅读 · 0 评论 -
HTAP 技术的原理、实现
HTAP(Hybrid Transactional/Analytical Processing)是一种新兴的数据库架构设计理念,旨在解决传统数据库中事务处理(OLTP, Online Transaction Processing)和分析处理(OLAP, Online Analytical Processing)分离的问题。通过将事务和分析能力集成在一个统一的平台上,HTAP 系统能够实时处理数据并进行深度分析,而无需在两个系统之间进行复杂的数据同步操作。原创 2024-11-22 09:00:00 · 1977 阅读 · 0 评论 -
Seata 分布式事务管理全解析
Seata(Simple Extensible Autonomous Transaction Architecture)是一个开源的分布式事务解决方案,旨在解决分布式系统中跨多个服务或数据库的事务一致性问题。由阿里巴巴于 2019 年开源,Seata 的设计目标是提供一个简单且高效的全局事务管理框架,使得开发者能够在微服务架构中轻松处理分布式事务。原创 2024-11-15 13:47:33 · 2016 阅读 · 0 评论 -
ShardingSphere 使用指南
这种设计避免了多个节点重复加载元数据的问题,并确保在执行 DDL 操作后,其他节点能够及时感知元数据的变化,保持数据一致性。ShardingSphere 通过数据分片和读写分离,将数据和流量分散到多个数据库实例上,提升系统的吞吐量和响应速度。ShardingSphere 提供灵活的数据分片策略,可根据租户标识将数据分配到不同的表或库中,实现数据隔离。ShardingSphere 提供完整、透明、安全、低成本的数据加密及脱敏解决方案,确保敏感数据在存储和传输过程中的安全性,满足数据安全与合规的要求。原创 2024-11-15 13:34:18 · 2408 阅读 · 0 评论 -
Trino深度解析
Trino 的连接器通过 Connector API 实现与外部数据源的集成。原创 2024-10-25 09:30:00 · 3147 阅读 · 0 评论 -
DragonflyDB 集群支持、持久化与高可用性详解
DragonflyDB 是一种高性能的内存数据库,专为处理大规模并发和极低延迟的需求而设计。它旨在取代传统的 Redis 和 Memcached 等内存数据库,在相同硬件资源下提供更高的吞吐量和更高效的内存使用。DragonflyDB 的核心设计目标是通过多线程架构、优化的内存管理以及并发处理模型,为开发者提供一个高效且可扩展的 NoSQL 数据库解决方案。是一个高性能、可扩展的内存数据库,具有诸多显著优势,使其在多种应用场景中表现出色。多线程架构的高并发处理能力。原创 2024-10-25 09:00:00 · 2300 阅读 · 0 评论 -
深入解析 Aerospike高性能分布式数据库的利器
Aerospike是一款高性能、分布式的 NoSQL 数据库,专为需要快速响应和高吞吐量的应用而设计。它最初于 2009 年由 Brian Bulkowski 和 Srini Srinivasan 创立,旨在解决广告实时竞价(RTB)系统中对超低延迟和高可靠性的需求。主要特点:亚毫秒级延迟:提供极低的读写延迟,满足实时性要求高的业务。高吞吐量:支持每秒数百万级别的事务处理。线性扩展:通过增加节点,能够线性提升集群的存储容量和处理能力。强一致性:支持可配置的强一致性模型,确保数据的准确性。原创 2024-10-24 09:15:00 · 1606 阅读 · 0 评论 -
Cassandra的核心优势与未来演进方向
这种架构使得Cassandra的扩展非常简单:当集群负载增加时,添加新的节点即可,而无需对已有的节点进行调整。机制,将数据暂时存储在其他节点上。当故障节点恢复时,这些节点会将暂存的数据发送回故障节点,确保最终的一致性。格式存储数据,当新的SSTable生成时,旧的数据不会被立即删除,而是通过压缩和合并(Compaction)机制来维护数据的高效存储和查询性能。通过合理调整一致性级别,并通过节点的无缝扩展,Cassandra能够在性能、可用性和一致性之间找到最佳平衡,满足不同应用场景下的需求。原创 2024-10-15 09:30:00 · 1702 阅读 · 0 评论 -
Redisearch 入门指南构建高性能搜索应用
Redisearch 是一个强大的全文搜索引擎,基于流行的 Redis 数据库构建,专为高效的数据检索而设计。它结合了 Redis 的快速存储能力和搜索引擎的复杂查询功能,使得开发者能够在海量数据中实现实时搜索体验。Redisearch 支持丰富的特性,包括模糊匹配、布尔搜索、聚合、地理位置查询等,极大地增强了搜索的灵活性和准确性。这使其在电商、内容管理、社交平台等领域得到了广泛应用。原创 2024-09-25 13:25:22 · 2786 阅读 · 3 评论 -
Redis Pipeline 使用指南:从基础到进阶
Redis 是一个开源的内存数据结构存储系统,广泛用于缓存、消息代理和实时数据处理等场景。它以高性能和灵活性著称,支持字符串、哈希、列表、集合等多种数据结构,适合于多种应用。Redis Pipeline 是一种优化技术,允许客户端批量发送多个命令而无需等待每个命令的响应。这种方式显著减少了网络延迟,提高了处理速度,尤其在需要执行大量操作时,能有效提升性能。通过利用 Redis Pipeline,开发者可以更高效地进行数据存取操作,增强应用的响应能力。原创 2024-09-29 09:30:00 · 951 阅读 · 0 评论 -
Greenplum数据库全面解析
为了满足企业的大规模数据处理需求,项目团队决定使用Greenplum作为核心的数据仓库平台,主要因为其强大的并行处理能力和与大数据生态的集成能力。Greenplum作为数据仓库的核心:处理来自不同数据源的数据,进行批量数据导入、清洗和转换。Kafka用于实时数据流处理:收集来自线上商城和门店的实时交易数据,并通过外部表将数据实时加载到Greenplum中进行分析。Hadoop用于历史数据存储:使用HDFS作为冷数据的存储,Greenplum通过外部表对接HDFS中的历史数据,减少系统的存储压力。原创 2024-09-23 09:30:00 · 3047 阅读 · 0 评论 -
Neo4j技术指南
数据模型:使用表、行和列来表示数据,数据之间的关系通过外键和JOIN操作来实现。使用节点和关系直接表示实体和实体之间的关联,数据模型更贴近真实世界的关系网络。查询性能:在处理复杂的关联查询时,随着数据量和关系层级的增加,JOIN操作的性能会显著下降。由于关系被直接存储,查询复杂关系时性能表现稳定,高效地支持深度关系遍历。扩展性:垂直扩展为主,受限于单机性能,水平扩展复杂且成本高。更易于水平扩展,能够更好地适应大规模数据和高并发的应用场景。语法特点:声明式查询。原创 2024-09-21 10:00:00 · 1635 阅读 · 0 评论 -
深入解析 Apache Doris架构、应用场景与最佳实践
Apache Doris 是一款现代化的 MPP(Massively Parallel Processing)数据库,专注于解决大规模数据分析和实时查询的需求。它最初源自百度的 Palo 项目,随后贡献给了 Apache 基金会,并在开源社区的共同努力下不断演进。Doris 的设计目标是提供高效、简洁、易于使用的分析型数据库,能够在海量数据下进行快速响应的查询处理,尤其适用于数据仓库、BI 分析、以及实时数据处理场景。Doris 的核心优势之一在于其简化的架构和无缝的数据处理能力。原创 2024-09-19 09:00:00 · 3516 阅读 · 0 评论 -
深入理解 ClickHouse 的性能调优与最佳实践
ClickHouse是一款由 Yandex 开发的开源列式数据库,专为在线分析处理(OLAP)场景设计。它以极高的查询性能著称,尤其适用于大规模数据的快速聚合和分析。自发布以来,ClickHouse 在多个行业中得到了广泛应用,例如日志分析、监控系统、用户行为分析、广告监控等。ClickHouse 的核心优势在于其列式存储架构高效的数据压缩、以及分布式处理能力。这些特性使得它能够在处理 TB 甚至 PB 级别的大数据时,依然保持快速的响应时间。原创 2024-09-17 09:15:00 · 2669 阅读 · 0 评论 -
MySQL NDB Cluste-分布式数据库集群搭建
###1 概述####1.1 分布式数据库集群Mysql cluster是适用于分布式计算环境的高可用、高冗余版本的mysql,其技术在分布式系统中为mysql数据提供了冗余特性,增强了安全性,使得单个mysql服务器故障不会对系统产生巨大的负面效应,系统的稳定性得到保障。Mysql cluster采用shared-nothing(无共享)架构,主要利用了NDB存储引擎来实现,NDB存储引擎是一个内存式存储引擎,要求数据必须全部加载到内存之中,具有自动分片(分区)功能。数据被自动分布在集群中的不同存储节原创 2021-07-13 15:22:27 · 6691 阅读 · 0 评论 -
Ubuntu数据库安装(mysql)
ubuntu安装mysql及修改数据目录原创 2023-03-11 04:45:32 · 3815 阅读 · 0 评论 -
Ubuntu安装mysql数据库(包括切换数据目录)
1.下载mysql-apt-config_0.8.22-1_all.deb并且安装wget https://dev.mysql.com/get/mysql-apt-config_0.8.22-1_all.debsudo dpkg -i mysql-apt-config_0.8.22-1_all.deb2.更新apt-updatasudo apt update3.如果出现如下图情况执行以下命令sudo apt --fix-broken install4.安装mysql-servers原创 2022-01-25 17:50:20 · 1812 阅读 · 0 评论 -
InfluxDB安装(各平台)
1. 准备安装InfluxDB包需要root或是有管理员权限才可以。2.网络InfluxDB默认使用下面的网络端口:TCP端口8086用作InfluxDB的客户端和服务端的http api通信TCP端口8088给备份和恢复数据的RPC服务使用另外,InfluxDB也提供了多个可能需要自定义端口的插件,所以的端口映射都可以通过配置文件修改,对于默认安装的InfluxDB,这个配置文件位于/etc/influxdb/influxdb.conf。3.NTPInfluxDB使用服务器本地时间给数据原创 2022-03-03 14:08:15 · 5321 阅读 · 1 评论 -
GraphBase基础原理
互联网时代,随着网络技术的发展,企业积累的数据越来越多。伴随着数据集的不断增加,传统的关系型数据库查询性能会随之变差,特别是针对一些特殊的业务场景,所以迫切的需要一种新的解决方案去应对这种危机。为了解决复杂的关系问题,图数据库应运而生。图数据库,是指以“图”这种数据结构存储和查询数据,图包含节点和关系,节点和关系可以存在标签和属性,且边可以有方向。原创 2023-09-15 09:35:00 · 7476 阅读 · 0 评论