AI大模型产品,在生产环境安装部署时,部署产品使用harbor仓库时,会遇到容器启动报错:dial tcp 127.0.0.1:1514: connect: connection refused的异常问题
经过分析,发现在不同操作系统,尤其是国产操作系统,以及ubuntu等操作系统,出现启动失败,异常的问题频率更高。harbor不同版本出现的频率不一样,有的版本频繁,有的比较低,导致网上出现很多解决方法,但都是治标不治本,而且不利于不同操作系统的安装部署。尤其是产品,在迭代测试阶段,经常构建生产环境异常,导致harbor异常,需要自动恢复harbor服务时,该异常,会导致harbor容器服务无法自动恢复。当然,生产环境,遇到harbor的各类异常问题比较多,针对比较棘手的问题,都会在本篇博客记录并更新。
本篇博客,针对harbor v2.12.0较新的harbor版本,该版本以下或以上,都存在类似问题,只是出现频率不一,异常信息可能比较多,让研发人员花费大量时间和精力,去定位解决。有可能去排查,操作系统DNS、网络、docker、docker网桥、系统日志rsyslog,harbor配置、harbor服务镜像、容器或harbor相关源码等,可