
实战经验
文章平均质量分 91
以实战排查问题为主。介绍的都是实际工作中遇到的疑难问题,以及在工作中真正落地的技术方案或最佳实践。将最真实的工程经验分享给大家。
Alan CGH
从500强外企干到头部二手电商公司,目前流落到央企搞数字化
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Spring事务开发经验 回滚和不回滚?
工作中使用Spring事务控制时候需要注意什么?Spring 事务中 catch 异常后会回滚吗?有2种说法:1.如果事务中 catch 了异常并且不抛出,事务不会回滚。2.如果事务中 catch 了异常,但是事务依然回滚。本文配合源码和实验例子说明,什么情况下抛出异常事务回滚。原创 2025-04-29 14:22:34 · 775 阅读 · 0 评论 -
大事务+定时任务=线上故障?
通过华润工作中的一个真实线上小故障介绍长事务的危害,以及如何定位分析问题。对长事务的解决手段有哪些。原创 2025-01-09 14:11:57 · 323 阅读 · 0 评论 -
高并发写利器-组提交,我的Spring组件实战
介绍高并发写的常用优化手段,解析MySQL组提交原理,基于批量顺序写理论实现组提交组件。对比组提交和单条提交的两种测试用例,进行压测得出组提交比单提交性能高出很多。原创 2025-01-04 20:10:04 · 732 阅读 · 0 评论 -
排查和解决JVM OOM实战
本文深入探讨Java虚拟机(JVM)中的内存区域布局及常见的内存溢出错误(OOM)类型,不仅限于堆内存,还包括元空间和直接内存等。通过沃尔玛支付中台的实战案例,详细解析了一次因内存泄漏导致的OOM事故排查过程。从问题表现、排查手段到最终解决方案,全面展示了如何运用jmap、MAT等工具定位内存泄漏点,并修复代码以避免类似问题再次发生。无论你是Java开发者还是系统运维人员,都能从中获得宝贵的经验和技巧,提升系统稳定性和性能。原创 2024-10-06 13:05:54 · 1291 阅读 · 1 评论 -
深入分析MySQL假死故障
那是大半年前的一次线上DB故障。原创 2024-07-28 23:55:09 · 784 阅读 · 0 评论 -
K8S Docker搭建RocketMQ Dledger高可用集群
讲解RocketMQ最流行的3种集群部署模式以及它们之间的差异。带你用3台小机器结合K8S和Docker搭建一个高可用具备failover能力的生产集群。实现TPS 6000和百万消息收发的RocketMQ集群。原创 2024-08-04 10:31:58 · 1450 阅读 · 4 评论 -
canal消费binlog异常排查
在生产上遇到了canal同步es数据突然中断的问题,初步查看是发现MQ没有继续发送消息同步数据了。随着排查深入发现是K8S的pod节点内存不够导致的驱逐pod,canal-server被重启,canal-client和server断开连接,消费线程遇到异常没有进行合适的处理,打了错误日志退出消亡。学习了canal原理,伪装成slave节点向master拉取binlog并转化为自定义的DML event给用户消费。还学习了canal通过zookeeper的强CA机制实现多节点的HA机制。原创 2024-09-17 15:04:10 · 1749 阅读 · 0 评论 -
MySQL优化实战 解决CPU100%
深入排查并优化数据库CPU周期性打满问题的经历。问题表象为每小时整点03分数据库CPU使用率飙升,持续一分钟后恢复正常。首先排除了业务流量暴增的可能性,聚焦于定时任务。通过详细分析,发现任务状态修改的Job中,通过临时方案解决了问题,并讨论了进一步的优化空间。本文揭示了慢SQL对数据库性能的影响,以及如何通过日志分析和索引优化来解决问题。原创 2024-10-02 12:38:02 · 1811 阅读 · 0 评论