
故障集
QwQNightmare
我是一只萌萌哒的饿膜人
展开
-
故障:在做Kubernetes代理时使用keepalived做代理高可用,无法访问虚拟vip
故障:在做Kubernetes代理时使用keepalived做代理高可用,无法访问虚拟vip前提在解决了之前的nginx的问题后,配置keepalived。感觉一帆风顺在配置文件中也写好了vip,使用:ip a 命令也能查看到vip在master节点,经过测试vip也能够漂移到back up节点上。我觉得万无一失了。正当我用浏览器访问vip时,却无法打开网页。于是我ping 虚拟IP也ping...原创 2020-05-02 13:38:21 · 1181 阅读 · 0 评论 -
在搭建Kubernetes时nginx代理时,报错:unknown directive “stream” in /usr/local/nginx
在搭建Kubernetes时nginx代理时,报错:unknown directive “stream” in /usr/local/nginx我在搭建Kubernetes代理时,用手动编译安装nginx后,修改nginx.conf配置文件。stream {#定义日志的格式和日志文件的路径 log_format main '$remote_addr $upstream_addr -...原创 2020-05-02 13:26:53 · 1491 阅读 · 0 评论 -
报错:使用amoeba做mysql数据库读写分离,客户端连接amoeba出现ERROR 2006 (HY000): MySQL server has gone away
报错:使用amoeba做mysql数据库读写分离,客户端连接amoeba出现ERROR 2006 (HY000): MySQL server has gone away今天在做数据库的读写分离时,在最后一部出现了报错。(很难受qaq)仔细一想 报错提示是无法连接数据库服务,那么之前我已经做好了数据库的主从复制,有可能是amoeba无法登陆到数据库。于是我检查了amoeba.xml配置文件,结...原创 2020-04-23 12:20:31 · 588 阅读 · 0 评论 -
企业生产环境服务故障排障思路心得总结
企业生产环境服务故障排障思路心得总结起因:这周在部署某企业内部防火墙时,因为没有与企业内部网络运维工程师进行及时有效的沟通,导致业务迟迟没有上线。服务始终无法发布到公网上。在经过多次测试与排障之后,终于将业务顺利上线。总结:经过长时间在生产环境担任运维工作,本人也总结了一些排障思路希望可以帮助到苦于排障但又没有思路的小伙伴们。1.首先你得有故障,即发现问题。比如说经常会有的什么服务又没有...原创 2020-04-10 23:53:28 · 683 阅读 · 0 评论 -
故障:最小化安装Linux系统,无法使用killall命令
故障:最小化安装Linux系统,无法使用killall命令起因:用最小化安装nginx时,在**/etc/init.d**目录下配置nginx启动脚本时,发现用命令:systemctl stop nginx无法关闭nginx。但是通过命令pkill -9 nginx,可以关闭nginx。我的nginx启动脚本:#!/bin/bash# chkconfig: - 99 20# de...原创 2020-04-07 18:51:23 · 704 阅读 · 0 评论 -
报错:CEPH初始化mon服务出错,mon.ceph02 monitor has reached quorum!
报错:在初始化mon服务的时候出现:[ceph_deploy.mon][INFO ] mon.ceph02 monitor has reached quorum![ceph_deploy.mon][ERROR ] Some monitors have still not reached quorum:[ceph_deploy.mon][ERROR ] ceph01分析:看到这个报错...原创 2020-03-30 19:05:36 · 4771 阅读 · 1 评论 -
报错:kibana查询不到日志信息
报错:elk集群中kibana查询不到日志信息在搭建好elk之后发现kibana查询不到任何日志信息。之后我又去查看logstash和elasticsearch都在正常运转,配置文件也没有问题。elasticsearch-head也可以正常抓取日志。原因:两台主机之间时间不同步,并不是什么大问题,由于时间不同步导致日志搜寻不到。解决:使用ntpdate命令进行时间同步,问题很快就解决...原创 2020-03-25 23:50:37 · 3908 阅读 · 0 评论 -
报错:[ERR] Node 192.168.80.101:6379 is not empty.redis集群创建失败
分析:分析错误发现原有redis集群中已经写入了数据。处理:1.先关闭redis,删除原有集群信息,和备份。2.开启redis,进入数据库,重置数据库和重置集群。flushdb #重置数据库cluster reset #重置集群这样就可以重新搭建新的集群了。...原创 2020-03-22 12:52:59 · 823 阅读 · 0 评论 -
报错:安装Redis集群出现错误,zmalloc.h:50:31: 致命错误:jemalloc/jemalloc.h:没有那个文件或目录
原因:在安装Redis集群时make的时候出现了:zmalloc.h:50:31: 致命错误:jemalloc/jemalloc.h:没有那个文件或目录这个报错。分析&解决:在搭建集群时没有安装编译器,gcc、 gcc-c++ 、make 。然而在安装后还是无法编译。这时需要先删除解压包,再重新解压一遍就可以正常编译了。删除原有解压包,安装gcc、gcc-c++和make。再次重新解...原创 2020-03-19 10:43:03 · 2674 阅读 · 0 评论 -
故障:客户机无法通过squid透明模式访问WEB
故障:在web服务器上的日志文件中查看发现虽然是squid的透明模式,来访的IP地址却还是客户机ip。在解决问题之前来访记录都是客户机的IP地址。分析:因为客户机是可以ping通web的说明网络没有问题。检查squid进程和端口发现一切正常。因为存在路由的关系,并且透明模式是关闭代理的,所以客户机并没有通过代理去访问web,而是直接通过路由去访问web。解决:在代理服务器上设置端口映射的规...原创 2020-03-17 22:42:13 · 448 阅读 · 0 评论 -
故障:OpenStack热迁移虚拟机失败
故障:OpenStack热迁移虚拟机失败起因:在OpenStack中使用热迁移功能将虚拟机迁移至其他节点,结果操作失败。分析:在OpenStack群集之中,热迁移需要通过open vswitch建立二层的联系。所以在控制节点查看网络代理情况(neutron agent-list),结果发现open vswitch服务挂掉。处理:在相应的节点重启open vswitch服务,并再次查...原创 2020-03-09 22:19:57 · 977 阅读 · 0 评论 -
报错:phpize Can't find PHP headers in /usr/include/php
报错:phpize Can’t find PHP headers in /usr/include/php起因在搭建memcached的时候,在客户端首先需要搭建LAMP架构。后来在搭建memcached客户端时:用php为memcached添加编译,名令:/usr/local/php5/bin/phpize。出错:phpize Can’t find PHP headers in /usr/in...原创 2020-03-08 19:33:35 · 408 阅读 · 0 评论 -
故障:OpenStack安装修改网卡名称无法变成eth0的解决方法
故障:OpenStack安装修改网卡名称无法变成eth0的解决方法故障:在安装centos 7.5前,修改网卡名称为eth0,修改命令为:net.ifnames=0 biosdevname=0.目的是安装OpenStack集群网卡为eth0,结果安装好系统的时候发现网卡名称依旧是:ens33.原因:输入的命令并有生效,即并没有写入到grub中,使得安装时无法将eth0加入到变量之中。解...原创 2020-03-07 16:52:29 · 575 阅读 · 0 评论 -
故障:CEPH集群健康检查时间不同步问题
CEPH集群健康检查时间不同步问题在做OpenStack集群的CEPH时,安装完mgr组件后,ceph -s检查群集健康状态,发现群集时间不同步。原因:1.由于节点之间存在时间差,可能是由于快照还原导致的。2.可能由于OpenStack和CEPH太占用硬件设备资源导致一些服务没有启动成功。解决方法:1.所有节点对控制节点进行时间同步操作,ntpdtae 节点名称。2.所有节点服务...原创 2020-03-07 16:21:45 · 1796 阅读 · 0 评论