- 博客(6)
- 收藏
- 关注
原创 华为裸金属昇腾Atlas 900A2 P0D(910B)部署Deepseek蒸馏70b LLaMA模型
注:因为openui需要跟本地的模型通信,本地模型docker网络通信采用的是host模式,openui也要采用此方式,然后做持久化挂载,使用docker-compose up -d启动即可,默认的端口是8080。模型可视化对话用的最多的就是openweb-ui,参考了大部门的教程都是使用python3.11安装的,用3.11会破坏现有的环境,会冲突,所以就使用了docker-compose的方式。下载方式有很多,个人比较推荐git lfs,比较简单一些,最终的目的是把模型下载下来就可以。
2025-03-12 14:00:16
1602
原创 k8s华为,阿里云waf防火墙获取访问用户真实ip
服务部署在K8s上,K8s会将真实的客户端IP记录在X-Original-Forwarded-For字段中,并将WAF回源地址记录在X-Forwarded-For字段中。4.将业务程序获取客户端真实IP的字段修改为X-Original-Forwarded-For或者X-Forwarded-For,不区分大小写。华为云:kubectl -n kube-system edit cm cceaddon-nginx-ingress-controller。1.执行以下命令修改配置文件。
2024-06-20 16:59:47
489
1
原创 k8s 负载均衡算法
在 Kubernetes (k8s) 中,服务的负载均衡默认使用的是轮询算法(Round Robin)。这种算法会将请求按顺序依次分配给每一个后端 Pod。当一个请求被分配后,下一个请求会被分配给下一个 Pod,循环往复。
2024-06-20 16:47:55
783
原创 ArgoCD 自动同步延迟,同步镜像延迟
这个日志输出中所默认的触发的分支为 revision: master ,如果是别的分支别的环境项目,在添加hooks钩子的时候写入分支的名称即可。在gitlab的项目yaml仓库中,进入该项目,点击左侧的设置,进入Webhooks菜单。使用现有的集成,右侧URL写入argocd的地址,后面加路径,例如。下方的Secret Token(这个地方也是可选的,建议用上)这个时候去看集群里面的argocd-server这个容器的日志。因为默认的hooks增加的是push操作才会触发这个钩子。
2023-05-24 17:05:24
1200
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人