昨晚工程割接,遇见了系列灵异现象。
一台web server上的apache进程数只增不减,对应的resin线程数也是如此
想把apachedown掉重启
apachectl stop无响应。
手动kill掉全部httpd.netstat发现web端口还有部分连接未释放
重新启动,
apachectl start仍然无响应,过了将近20分钟发现才起来。
中间排查过程略过
相关现象
ssh到其他主机很慢
ping/telnet到其他主机较快
定位为反向解析问题
配置DNS(/etc/resolve.conf),同时设定解析顺序为local->bind后故障解决。(/etc/netsvc.conf)
apache启动很快,也没有出先连接不释放问题。
分析时因为aix默认的解析顺序为bind->local,在不设置dns的情况下,会造成需要反向解析非常慢的情况