
数据库
文章平均质量分 54
SQL NOSQL数据库
学亮编程手记
学亮编程手记
展开
-
python pymysql报错:pymysql.err.OperationalError: (1130, “host.docker.internal‘ is not allowed to conne
主机名连接MySQL时被拒绝,原因是MySQL服务器未授权该主机访问。这个错误表明您的Python脚本尝试通过。若仍失败,尝试直接使用宿主机IP替代。,并检查DNS解析是否正常。原创 2025-04-01 15:09:16 · 595 阅读 · 0 评论 -
python统计MySQL表增长率并发送邮件
【代码】python统计MySQL表增长率并发送邮件。原创 2025-04-01 11:33:57 · 240 阅读 · 0 评论 -
Linux centos7 离线环境快速安装 SQLite3 的二进制版本(无需编译和额外下载)
使用 U 盘或其他存储设备,将下载好的二进制文件传输到离线的 CentOS 7 机器上。下载适用于 Linux 的预编译二进制文件。,这是一个包含命令行工具的 64 位二进制包。如果安装成功,会显示 SQLite 的版本号。命令行工具复制到系统的可执行路径中。原创 2025-04-01 10:15:41 · 308 阅读 · 0 评论 -
python代码案例:实现监控 MySQL 表数据文件增长趋势并触发告警的完整代码
中的数据库连接和告警参数。代码实现步骤如下——原创 2025-03-28 17:01:11 · 247 阅读 · 0 评论 -
Doris 配置解释:(replication_allocation = “tag.location.default: 1“)
是一个与数据副本分配策略相关的参数,用于指定默认资源组(在 Apache Doris 或类似分布式数据库系统中,)中数据副本的数量。原创 2025-03-28 15:55:59 · 135 阅读 · 0 评论 -
Doris 参数查看及启用:enable_disk_balance_for_single_replica(同一个 BE 节点的不同磁盘间数据均衡)
在 Apache Doris 中,所有前端(FE)的配置参数均可通过 MySQL 客户端登录后执行命令查看。原创 2025-03-28 15:52:36 · 269 阅读 · 0 评论 -
Doris BE节点数据分布不均的解决方案
BE节点数据分布不均的解决需结合参数调优、分区分桶设计、异常处理及监控策略。重点关注分桶列的合理选择、自动分桶功能的应用,以及均衡任务的执行效率。若问题复杂,建议结合日志分析和社区工具(如Doris健康检查脚本)进一步诊断。原创 2025-03-28 15:16:22 · 333 阅读 · 0 评论 -
Doris BE 节点通过资源标签(tag.location)实现负载均衡的完整方案
通过资源标签实现负载均衡的核心逻辑是。原创 2025-03-27 09:43:16 · 345 阅读 · 0 评论 -
Doris 3.0.1 文档手册:BE 配置项详解
该文档主要介绍 BE 的相关配置项。BE 的配置文件be.conf通常存放在 BE 部署路径的conf/目录下。而在 0.14 版本中会引入另一个配置文件。该配置文件用于记录用户在运行时动态配置并持久化的配置项。BE 进程启动后,会先读取be.conf中的配置项,之后再读取中的配置项。中的配置项会覆盖be.conf中相同的配置项。原创 2025-03-27 09:21:57 · 902 阅读 · 0 评论 -
Doris 3.0.1 BE 组件 disable_query 参数的作用与配置方法
后,Doris 的 Frontend(FE)将不再向该 Backend(BE)节点分配新的查询请求(如 SELECT 操作)。避免一次性禁用过多 BE 节点,导致剩余节点压力过大。建议结合资源标签(Tag)和资源组(Resource Group)实现精细化流量管理。已分配到该 BE 的正在执行的查询会继续完成,仅阻止新请求路由到此节点。)实现计算与导入任务的资源隔离,确保高优先级任务不受干扰。分析查询计划,确认目标 BE 未参与查询执行。并重启节点(通常不建议,动态调整更灵活)。,观察其他 BE 节点的。原创 2025-03-27 09:17:19 · 120 阅读 · 0 评论 -
MySQL设置缓冲池和临时表的大小
缓冲池就像是一个大盒子,里面可以放很多东西。在MySQL中,这个“盒子”用来存放从硬盘上读取的数据页(也就是数据块)。当你第一次从数据库中读取数据时,MySQL会把数据从硬盘读到内存中的缓冲池里。这样,当下次再需要这些数据时,就可以直接从内存中快速获取,而不需要再去慢得多的硬盘上读取了。这就像你把常用的书放在书桌上,而不是每次都去书架上找一样。临时表就像是你在做作业时用的草稿纸。当你在解决一个问题时,可能需要做一些中间计算或存储一些临时数据。这时,你可以创建一个临时表来保存这些数据。原创 2025-03-18 17:02:13 · 142 阅读 · 0 评论 -
MySQL缓冲池和临时表
缓冲池是数据库管理系统中用于缓存数据页(通常是磁盘上的数据块)的一块内存区域。它的主要作用是减少磁盘I/O操作,提高查询性能。当数据库系统需要读取或写入数据时,它会首先检查缓冲池中是否已经存在所需的数据页。如果存在,则直接从内存中读取;如果不存在,则从磁盘读取并放入缓冲池中。临时表是一种特殊的表,用于存储中间结果集。它们通常在查询执行过程中创建,并在查询完成后自动删除。临时表可以存在于内存中或磁盘上,具体取决于数据量和数据库系统的配置。原创 2025-03-18 16:58:54 · 186 阅读 · 0 评论 -
ProxySQL 安装及使用示例:通过 ProxySQL 实现 SQL 请求的过滤、重写和负载均衡
ProxySQL 是一款高性能的 MySQL 中间件,主要用于 SQL 请求的代理、负载均衡和查询过滤。以下是如何使用 ProxySQL 拦截或重写特定 DELETE 语句的示例。通过 ProxySQL,可以轻松实现 SQL 请求的过滤、重写和负载均衡。在 ProxySQL 中配置规则,拦截。原创 2025-03-18 15:33:10 · 742 阅读 · 0 评论 -
MySQL动态改写binlog日志的几种实现思路
【代码】MySQL动态改写binlog日志的几种实现思路。原创 2025-03-18 15:07:17 · 424 阅读 · 0 评论 -
Flink CDC 通过 Debezium Scripting SMT 处理CDC数据变更事件配置示例
在 Flink CDC 管道中配置 SMT(Single Message Transformation)主要用于对 CDC 捕获的数据变更事件进行实时处理、过滤或格式转换。参数添加 SMT 配置。以下是一个过滤特定操作(如仅保留。通过 Flink SQL 的。原创 2025-03-18 14:55:26 · 306 阅读 · 0 评论 -
SeaTunnel配置示例:允许delete单行删除,过滤范围删除
SeaTunnel CDC 支持 Schema Evolution,但需确保目标表(如 Doris)的结构与源表一致。若源表发生 DDL 变更(如字段类型修改),需同步更新过滤条件中的字段类型映射。在 Apache SeaTunnel CDC 中,要实现对特定格式的 DELETE 语句过滤(如仅允许。解析 DELETE 语句的 WHERE 条件,通过正则表达式或逻辑判断过滤范围删除操作。,既能灵活控制过滤逻辑,又避免对数据库层侵入性修改。的 SQL 过滤条件,仅保留符合。原创 2025-03-18 14:51:57 · 874 阅读 · 0 评论 -
SeaTunnel 实现 MySQL 到 Doris 的全量和增量数据同步,并配置 SQL 级别的数据过滤
【代码】SeaTunnel 实现 MySQL 到 Doris 的全量和增量数据同步,并配置 SQL 级别的数据过滤。原创 2025-03-18 14:47:55 · 791 阅读 · 0 评论 -
SeaTunnel 与 DataX、Sqoop、Flume、Flink CDC 对比分析
SeaTunnel是综合能力最强的工具,尤其在复杂场景支持和资源效率上领先。DataX和Sqoop更适合传统离线批量场景,但扩展性和实时性较弱。Flume在日志采集领域不可替代,而Flink CDC是实时 CDC 场景的首选。原创 2025-03-18 14:46:43 · 584 阅读 · 0 评论 -
Linux shell脚本:定时清理innobackupex备份进程(适用于备份进程未能预期完成的场景)
innobackupex备份进程如果未能正常结束,将会影响到MySQL数据库的运行时性能,尤其对磁盘IO造成过大压力。以下是 Shell 脚本完整内容,它会执行命令,提取输出结果中的 PID,并将其杀掉。同时,设置每天 7:30 定时执行该脚本——原创 2025-03-13 11:36:12 · 312 阅读 · 0 评论 -
Kettle Carte 组件使用示例:将作业分发倒多台服务器并行执行
Kettle Carte 是 Pentaho Data Integration(Kettle)的核心组件之一,主要作为轻量级 HTTP 服务器,用于远程执行、监控和管理 Kettle 作业(Job)与转换(Trans)。支持将作业/转换分发到多台服务器(Slave Server)并行执行,适用于大数据量场景下的负载均衡,通过集群模式提升处理效率。可配置独立资源库(文件或数据库资源库),通过 XML 文件定义端口、IP 绑定及用户认证(默认用户。,输入认证信息后可查看运行中的任务及日志。原创 2025-03-10 16:33:35 · 727 阅读 · 0 评论 -
linux centos7升级percona-toolkit为3.6.0解决posc报错:check-unique-key-change does not have an argument
linux centos7升级percona-toolkit为3.6.0解决报错:check-unique-key-change does not have an argument。原创 2025-03-09 14:11:18 · 181 阅读 · 0 评论 -
MySQL测试表结构和示例数据SQL脚本(基于pt-online-schema-change工具实现MySQL表自动化分区Shell脚本)
【代码】MySQL测试表结构和示例数据SQL脚本(基于pt-online-schema-change工具实现MySQL表自动化分区Shell脚本)原创 2025-03-08 18:26:49 · 698 阅读 · 0 评论 -
基于pt-online-schema-change工具实现MySQL表自动化分区Shell脚本:包含主键自动调整、唯一索引自动处理和分区维护功能
(date${DB_NAME}${DB_NAME}$(date配置文件示例。原创 2025-03-08 18:13:25 · 818 阅读 · 0 评论 -
实现MySQL表自动分区的SQL脚本示例
【代码】实现MySQL表自动分区的SQL脚本示例。原创 2025-03-08 17:48:17 · 271 阅读 · 0 评论 -
查看MariaDB数据库当前时区设置
验证时区设置的实际效果,适用于快速判断时区是否配置错误。:排查容器时区与MariaDB时区不一致的问题。执行以下SQL语句,可同时获取系统全局时区(:快速确认当前会话和全局时区是否一致。:需验证全局配置是否生效。)和服务器系统时区(原创 2025-03-04 14:20:21 · 321 阅读 · 0 评论 -
解决 pt-online-schema-change 工具使用时报错:replication filters are set on these hosts
参数(从库复制过滤规则),导致工具终止。mysql主从设置了。原创 2025-02-27 10:27:35 · 152 阅读 · 0 评论 -
MySQL slave_skip_errors = ddl_exist_errors 错误码说明(主从复制跳过指定DDL错误)
参数是 MySQL 5.6 及后续版本(包括 MySQL Cluster NDB 7.3+)中预定义的错误码集合,用于自动跳过主从复制中的常见 DDL 冲突错误。原创 2025-02-27 10:04:02 · 359 阅读 · 0 评论 -
MySQL slave_skip_errors 参数详解:用于指定从库在复制过程中自动跳过的错误码列表
用于指定从库在复制过程中自动跳过的错误码列表。当主从同步因特定错误中断时,从库可通过跳过这些错误继续执行后续的复制操作,避免人工干预。使用物理备份工具恢复从库时,若备份过程中存在未完成的DDL操作,可能导致同步错误,需通过此参数跳过。若从库因重复插入主键(错误码。可跳过冲突,继续同步其他数据。但从库已存在表(错误码。原创 2025-02-27 09:56:35 · 554 阅读 · 0 评论 -
在MySQL主从集群环境下使用 pt-online-schema-change 工具时的注意细节
在MySQL主从集群环境下使用。原创 2025-02-27 09:48:09 · 574 阅读 · 0 评论 -
pt-online-schema-change在线对MySQL表进行分区案例:通过 --alter 参数一次性完成 主键/唯一键修改 和 分区定义
通过 PT-OSC 对含主键/唯一键的表进行分区时,需通过--alter参数一次性完成主键/唯一键修改和分区定义,确保满足 MySQL 的分区约束。合理配置等参数,可最大限度降低对业务的影响,并保留快速回滚能力。建议在测试环境充分验证后再应用于生产环境。原创 2025-02-24 17:36:39 · 397 阅读 · 0 评论 -
pt-online-schema-change 工具 --alter 参数实现分阶段操作表
通过--alter参数动态修改PT-OSC 在创建临时表后,会执行--alter指定的 DDL 语句修改其结构。通过此参数,可在临时表上添加新字段、修改字段类型或添加索引,但无法直接替换为完全独立的表结构。分阶段操作步骤1:使用 PT-OSC 将原表结构修改为过渡结构(如添加必要字段)。步骤2:再次运行 PT-OSC,通过--alter调整至最终目标结构。此方法适用于复杂结构变更,但需注意数据一致性和操作耗时12。手动干预临时表(不推荐)修改操作需与--alter。原创 2025-02-24 17:30:29 · 507 阅读 · 0 评论 -
pt-online-schema-change工具锁机制分析及降低用户影响的优化参数
pt-osc 通过触发器和分批次拷贝机制,显著降低了锁表时间,仅在表切换时产生极短的阻塞。通过合理配置参数(如chunk-sizemax-load)和遵循最佳实践(如低峰期操作、主键检查),可进一步减少对用户操作的影响。对于超大规模表或高并发场景,建议结合主从架构和灰度发布策略,分阶段完成分区操作。原创 2025-02-24 17:22:04 · 638 阅读 · 0 评论 -
pt-online-schema-change配置:在保证在线DDL操作的同时,灵活控制表、触发器及数据的保留需求
通过上述参数调整,可在保证在线DDL操作的同时,灵活控制表、触发器及数据的保留需求。若原表已存在自定义触发器,工具会拒绝执行。需在操作前手动备份并删除原触发器。保留原表和新表会导致磁盘占用翻倍,需提前确保有足够空间。参数模拟操作流程,检查参数配置是否合理,再替换为。操作表必须包含主键或唯一索引,否则工具会报错。原创 2025-02-24 17:17:36 · 901 阅读 · 0 评论 -
DeepSeek模型微调:使用unsloth微调框架对DeepSeek-R1-Distill-Llama-8B模型进行微调,实现将SQL语句转换为自然语言描述的功能
本文介绍了使用unsloth微调框架对DeepSeek-R1-Distill-Llama-8B模型进行微调,实现将SQL语句转换为自然语言描述。数据集,该数据集包含SQL语句与对应的自然语言描述,适用于训练SQL转文本任务。微调后模型应能生成如“统计每位客户的总订单金额”的清晰描述。需确保输入包含SQL语句与目标描述的映射,并统一使用。1️⃣在Colab设置运行环境,安装必要的库和包。4️⃣测试微调后模型的性能,保存并上传微调的模型。3️⃣设置微调的超参数,启动微调过程。原创 2025-02-24 15:55:43 · 1601 阅读 · 0 评论 -
针对数据库数据训练大模型(如DeepSeek)以实现精准查询的综合技术方案:数据预处理、模型微调、查询优化等
基于搜索结果,以下是针对数据库数据训练大模型(如DeepSeek)以实现精准查询的综合技术方案,结合。原创 2025-02-24 13:39:42 · 635 阅读 · 0 评论 -
使用 pt-online-schema-change 处理MySQL 2亿行数据量的大表的适用性分析及失败回滚与应急预案
工具是合适的,但需合理配置参数并关注潜在风险。,使用 pt-online-schema-change。原创 2025-02-21 14:42:49 · 463 阅读 · 0 评论 -
MySQL分区:使用 pt-online-schema-change 工具对大表进行在线分区(无需停机)
MySQL 8.0+ 支持部分 Online DDL 操作,可直接对表。提供的工具,专门用于在线修改大表结构(如添加分区),监听 MySQL Binlog,解析。如果因特殊原因必须创建。表(例如需要保留原表。,且对业务影响最小。原创 2025-02-21 14:03:33 · 579 阅读 · 0 评论 -
doris 3.0.3 创建、查询与维护异步物化视图
异步物化视图 SQL 定义没有限制。原创 2025-02-19 10:39:11 · 846 阅读 · 0 评论 -
Doris 3.0.3 FE 配置参数大全
该文档主要介绍 FE 的相关配置项。FE 的配置文件fe.conf通常存放在 FE 部署路径的conf/目录下。而在 0.14 版本中会引入另一个配置文件。该配置文件用于记录用户在运行时动态配置并持久化的配置项。FE 进程启动后,会先读取fe.conf中的配置项,之后再读取中的配置项。中的配置项会覆盖fe.conf中相同的配置项。文件的位置可以在fe.conf通过配置项配置。原创 2025-02-19 10:33:10 · 1220 阅读 · 0 评论 -
Doris BE exec_mem_limit 参数配置方式
参数主要与 Doris 的 Backend (BE) 节点相关。这是因为查询的实际执行发生在 BE 节点上,而 Frontend (FE) 节点主要负责查询的解析、优化和调度等工作。原创 2025-02-18 16:46:48 · 253 阅读 · 0 评论