
大数据 运维
文章平均质量分 93
常见大数据故障与调优,
当前集群服务器3000台,存储量 70PB,数据量总的50PB 日流量3PB。
飛翔的大雁
这个作者很懒,什么都没留下…
展开
-
Avatar hadoop HA
Avatar hadoop HA (高可用)一.NameNode 、standbyNameNode 与 NFS二.故障总结1. 启停 standbyNameNode1)停止 standby2)启动 standby3)关注一下日志中是否有报错4)确认checkpoint是否正常完成2. Nfs故障导致的snn down问题恢复:1)问题:2)处理办法:3.NameNode重启流程(不中断服务)1)提...原创 2020-01-08 22:43:12 · 258 阅读 · 0 评论 -
大数据运维 - Linux 之 软中断(softirq )
Linux 之 软中断 (softirq )一、什么是软中断1. 什么是中断为什么要用中断① 什么是interrupt?② 为什么要用中断系统③ 中断 (故障现场处理手段)隔离变化保存当前工作“现场”2. 软中断由来3. 具体什么是软中断二、软中断与硬中断区别三、软中断的危害与排查一、什么是软中断1. 什么是中断为什么要用中断① 什么是interrupt?interfere in someone else’s activity 就是干扰其它人的事情。这就是所谓interrupt的本质。从计算机的语境原创 2022-01-03 10:49:29 · 917 阅读 · 0 评论