自动化运维
文章平均质量分 81
智能体格
一线大厂14年IT老兵,擅长互联网技术开发与项目管理,企业人工智能整体架构设计与应用落地,大模型训练/微调/推理,智能体开发。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
K8S中使用英伟达GPU
K8s-NVIDIA-Plugin是连接Kubernetes与NVIDIA GPU的关键组件,实现了容器化环境中GPU资源的统一管理。该插件通过DevicePlugin框架自动发现GPU硬件,支持整卡和MIG细粒度分配,并自动注入驱动与CUDA工具链。主要功能包括:GPU资源抽象为可调度单元、与容器运行时深度集成、提供监控指标等。典型应用场景涵盖AI训练、HPC计算和图形渲染。部署时需要预先安装NVIDIA驱动,配置容器运行时支持GPU挂载。原创 2025-06-14 15:32:51 · 1545 阅读 · 0 评论 -
Containerd高级命令行工具nerdctl
buildkitd是典型的C/S架构,客户端和服务端是可以在不同服务器上,而nerdctl在构建镜像的时候作为buildkitd的客户端,所以需要安装并运行buildkitd。等命令来管理conpose服务,这样使用containerd,nerdctl结合buildkit等工具就能完全代替docker在构建镜像,,镜像容器方面的管理功能。但是ctr没有构建镜像的命令,现在又不使用docker,但是nerdctl 就提供了。,不过到现在为止还没有 FIX,幸运的是这只是一个⚠️,不会影响我们的使用。原创 2024-08-28 14:17:15 · 1120 阅读 · 0 评论 -
使用ngrok实现项目本地部署公网访问(内网穿透)
官网地址:https://ngrok.com/tips:若使用邮箱注册自行认证。原创 2024-03-18 09:57:02 · 1194 阅读 · 0 评论 -
kuboard-spray 导入离线资源包
2. 将 kuboard-spray-resource.tar 复制到 kuboard-spray 所在的服务器(例如:10.99.0.11 的 /root/kuboard-spray-resource.tar)在 Kuboard-Spray 界面中导航到 “系统设置” --> “资源包管理” 菜单,点击 “离线加载资源包”,按界面提示操作,即可完成资源包的离线导入。# 3. 在 kuboard-spray 所在的服务器上执行,(例如:10.99.0.11)# 1. 在一台可以联网的机器上执行。原创 2024-01-31 20:26:15 · 767 阅读 · 0 评论 -
KUBERNETES资源对象POD、REPLICASET、DEPLOYMENT、SERVICE之间的关系
Pod、ReplicaSet、Deployment、Service之间的关系如下图Pod:Pod是一个或多个容器的组合,这些容器共享存储、网络和命名空间,以及如何运行的规范。Pod是Kubernetes的最小可部署单元。Pod的中文译词是豌豆荚,docker容器就像是豆子运行在豌豆荚内。ReplicaSet:先说下Replication Controller。Replication Controller的作用是确保Pod以指定的副本个数运行。ReplicaSet是Replication原创 2021-12-23 09:52:34 · 1353 阅读 · 0 评论 -
Centos-7快速升级到K8S-1.17.3
1、清理历史版本。将下面的命令保存为文件:uninstallk8s.shkubeadm reset -fmodprobe -r ipiplsmodrm -rf ~/.kube/rm -rf /etc/kubernetes/rm -rf /etc/systemd/system/kubelet.service.drm -rf /etc/systemd/system/kubelet.servicerm -rf /usr/bin/kube*rm -rf /etc/cnirm -rf /opt原创 2020-12-30 11:21:03 · 526 阅读 · 2 评论 -
[kubernates]Unable to update cni config: No networks found in /etc/cni/net.d
kubernates join failed,response:Jun 10 11:22:57 00VMTL-FabricPeer-172-19-102-59 kubelet[19992]: W0610 11:22:57.514771 19992 cni.go:213] Unable to update cni config: No networks found in /etc/cni/...原创 2019-06-10 11:44:34 · 25020 阅读 · 3 评论 -
[kubeadm join] It seems like the kubelet isn't running or healthy
[root@00VMTL-FabricPeer-172-19-102-59 ~]# kubeadm join 172.19.102.78:6443 --token u6zbdr.k2krdy0is29izjjm --discovery-token-ca-cert-hash sha256:6fbb8d21ba001706556b0bf9e8200dd4da713a7c045168cf027d166...原创 2019-06-10 10:12:32 · 7929 阅读 · 1 评论 -
Kubernetes-kubectl The connection to the server localhost:8080 was refused -did you specify
今天在Kubernetes的从节点上运行命令【kubectl】出现了如下错误:[root@k8snode1 kubernetes]# kubectl get pod The connection to the server localhost:8080 was refused - did you specify the right host or port?出现这个问题的原因是kubect...原创 2019-06-09 17:21:10 · 11999 阅读 · 3 评论 -
上传自己的镜像被拒绝denied: requested access to the resource is denied
docker push自己的镜像文件时报错:allen@ubuntu:/var$ sudo docker push allen-tomcat-appThe push refers to a repository [docker.io/library/allen-tomcat-app]fee32021a7ec: Retrying in 1 second 5722c4c406c8: Prep原创 2017-10-11 17:07:29 · 49388 阅读 · 4 评论 -
ubuntu安装python3.5并改默认python为3.5
1、使用下面命令sudo add-apt-repository ppa:fkrull/deadsnakes sudo apt-get update sudo apt-get install python3.5 2、然后输入python时启动的是python2.7输入python3时启动的是python3.4输入python3.5时启动的才是python3.53原创 2017-08-28 11:32:00 · 1358 阅读 · 0 评论 -
jenkins构建后执行部署脚本
net stop Tomcat7del "D:\program files\apache-tomcat-7.0.68-new\webapps\efc.eac.war.war"echo "执行命令 del D:\program files\apache-tomcat-7.0.68-new\webapps\efc.eac.war.war"rd /s/q "D:\program files原创 2017-01-11 11:02:34 · 18882 阅读 · 2 评论
分享