自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 OCEANBASE SYS租户不可用-STACK_SIZE

sys租户在执行sql时报错-4013,但看了sys租户的内存使用,都是正常的,不存在内存满的问题。然后通过日志发现这个sql是发到1017这个租户上执行的,这个meta租户返回了-4013。通过日志看内存模块,使用最大的模块是CO_STACK。这个模块使用大的原因是stack_size由默认的512KB改成了1MB。

2024-12-18 20:00:00 566

原创 OceanBase异常问题分析-GTS(一)

时间同步异常、集群不可用、重启集群hang住

2024-11-25 17:57:57 508

原创 OCEANBASE告警案例partition_table_check_interval

结果在凌晨这个告警又出现了,基于前面的两次的排查经验,先对网络丢包和时钟进行了检查,排除嫌疑。参数检查时发现此时的partition_table_check_interval当前值是1m(默认是30m),怀疑是值设置过小(集群扩容的时候进行此参数的调整),当网络轻微波动时过于敏感,引起此告警。调整好时钟同步后,此告警又出现了,于是开始展开第二轮的根因定位。至此这个case的跟踪结束。根据告警提示,怀疑是数据库时钟同步的问题,由于这套告警集群最近刚好进行了节点扩容,检查时钟同步发现确实有问题,进行了调整。

2024-10-10 19:30:00 374

原创 记一次OceanBase的集群crash案例JSON_ARRAYAGG

工作日下午16:00左右,突然OceanBase保障群里,消息响个不停,陆陆续续有人反馈,连不上了。博主第一反应这么多人反馈有问题,是不是集群挂了?惴惴不安的检查了下observer进程是否正常,果然,进程挂了,这下悬着的心终于死了。开始马不停蹄的故障应急。经厂商确认,此为当前版本OB3.2.3.1 bp5 bug,JSON_ARRAYAGG和DISTINCT同时使用导致触发此BUG。疯狂coredump,在后续的版本中已经修复,后续版本再遇到类似sql,会直接进行报错。返回的output如下。

2024-09-23 20:45:00 625

原创 【读书笔记】OceanBase Undo/Redo Log

日志由多个日志记录组成,每条日志记录对应一个重要操作,比如更新数据、删除数据、提交事务等,这些操作往往会改变数据库的一致性状态。日志空间最初在内存中由缓冲区管理器分配,日志记录则由日志管理器负责创建,缓存中的日志记录会被尽快写到持久性存储介质中。日志就是记录事务相关操作的文件,每个改变数据库的操作都会生成日志记录,在系统故障发生之后,我们可以通过日志将数据库恢复到一致性状态。事实上日志记录的类型还有很多,涉及的操作也不限于插入、更新、删除等基础操作,为了便于说明,在本节中我们只考虑对已有数据的更新操作。

2024-09-17 20:00:00 1729

原创 OceanBase索引创建的实现过程

这个条指令会先发到OBProxy中处理,OBProxy经过简单的解析与路由之后,随机的发送到集群中的一台OBServer上,这台OBServer称为中控OBServer。中控OBServer收到回包后,通过轮询任务状态来确认索引是否创建完成,最后中控 OBServer 再把状态回给 OBProxy,OBProxy 再返回给客户端。索引创建是一个非常常见的需求,那么在OceanBase中,是如何创建一个索引的呢,结合当前的自身理解,和大家一起交流下。当我们发起如下语句时,索引创建就开始了。

2024-09-13 20:22:31 548

原创 OceanBase字段无法扩容案例-字符集与字符序

如果同时指定了 CHARACTER SET charset_name 和 COLLATE collation_name,则使用字符集 charset_name 和字符序 collation_name。如果指定了 COLLATE collation_name 但未指定 CHARACTER SET,则使用与 collation_name 关联的字符集和指定的字符序。观察到该表的默认字符集utf8mb4、默认字符序utf8mb4_bin,而对应的扩容字段的字符集为utf8mb4、字符序未显示。

2024-09-12 20:00:00 576

原创 OceanBase大SQL引发的内存与CPU飙升案例

在本案例中,当时sql语句占用了租户的大量内存,挤占了memstore的内存。OCP触发告警的分母是:冻结阈值,随着租户内存被sql占用大部分,memstore的冻结阈值会降低,所以就会出现虽然只使用了800M的memstore,依然报警。答疑二:CPU跑满是因为memstore内存超限,触发了memstore限流导致(sql响应增加),从而造成CPU跑满。2.根据以上初步定位内存的主要是耗费在SQL_EXEC_CTX_ID上,再找到具体耗费内存的tid。疑问二:既然是内存使用过大,为什么CPU会告警呢?

2024-09-11 20:00:00 1407

原创 OceanBase异常查询案例_pushdown_storage_level

OCEANBASE异常查询案例_pushdown_storage_level

2024-09-10 17:50:01 1390 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除