- 博客(255)
- 资源 (51)
- 问答 (1)
- 收藏
- 关注

原创 CNCF随笔
1、kustomizekustomize和helm一样是k8s的yaml包管理工具,相较于Helm不需要学习一套特定领域配置语言,且是k8s官方的并集成进了kubectl。常见的术语:kustomization 指的是 kustomization.yaml 文件,或者指的是包含 kustomization.yaml 文件的目录以及它里面引用的所有相关文件路径;base 指的是一个 kustomization , 任何的 kustomization 包括 overlay,都可以作为另一个 kusto
2022-05-04 22:15:30
892

原创 K8s随笔
1、CRD.yaml编写:CRD的type:integer类型--reconcile的int类型,CRD的format:float64 type:number类型--reconcile的float64类型
2021-10-22 13:49:00
1962
2
原创 Python随笔
在 python 中,strings, tuples, 和 numbers 是不可更改的对象(值传递),而 list,dict 等则是可以修改的对象(引用传递)
2025-02-16 21:26:05
214
原创 AI Infra简单记录
2、在AI大模型推理过程中,向量数据库为大模型提供外挂知识库,提升模型时效性与准确性,提供缓存能力,减少调用开销,提升响应速度等。1. 在AI大模型训练过程中,向量数据库可以有效提升数据检索、特征提取等任务的效率。
2024-06-29 15:05:37
191
原创 kubeflow简单记录
5、Pipeline 基于Argo Workflow提供机器学习流程的创建、编排调度和管理,端到端机器学习系统的自动化敏捷构建,实现AI领域的DevOps。1、Training Operator 包括PytorchJob和XGboostJob,支持部署pytorch的分布式训练。3、Jupyter Notebook 基于Web的交互式工具。2、KFServing快捷的部署推理服务。4、Katib做超参数优化。pipeline流程。pipeline示例。
2024-05-07 09:39:23
427
原创 k8s之wait工具包
wait包位于github.com/kubernetes/apimachinery/pkg/util/wait,提供了通过监听一个条件的变化执行指定函数的工具函数.。 这些函数可以分为四大类:Until 类: 根据 channel 的关闭或者 context.Done 的信号 来决定函数是否继续执行(能够控制开始时/完成时计时,建议JitterUntilWithContext);Poll 类:根据 channel 的关闭或者 函数的返回值 来决定函数是否继续执行(函数执行遇到错误能够直接退出,建议P
2024-02-17 18:06:40
1309
原创 etcd随笔
大集群主要问题有 b+tree重平衡和分解过程中超过20Gi的性能瓶颈,是O(n)复杂度,启动耗时增大,放大expensive request的影响。其中最重要的就是最大程度地减少 expensive request。对几十万级别的对象数量来说,按标签还是获取所有cr等场景时,很容易造成 etcd 和 kube-apiserver OOM 和丢包,乃至雪崩等问题发生。
2023-10-09 09:56:28
2198
原创 etcd之读写请求的执行过程
首先,etcdctl 会对命令中的参数进行解析。在解析完请求中的参数后,etcdctl 会创建一个 clientv3 库对象通过gRPC API来访问 etcd server。对应流程一。然后通过负载均衡算法选择一个etcd server节点,然后调用 etcd server 的 KVServer 模块的 Range RPC 方法,把请求发送给 etcd server。在 etcd 3.4 中,clientv3 库采用的负载均衡算法为 Round-robin,对应流程二。
2023-08-30 14:49:06
1629
1
原创 k8s之Informer Store、Indexer、ThreadStore详解
Indexer 和 Store 都是基于 ThreadSafeStore 来实现的。Store实例和Indexer实例初始化的区别,就是没有 Indexers,Store 算是阉割版的 Indexer。ThreadSafeStore 的操作时需要使用 key 来对对象进行操作的,而 cache 的作用便是使用 cache.keyFunc 来计算对象的 key。
2023-07-02 22:14:24
705
1
原创 k8s之ReplicaSet回收pod的优先级
1、未被调度到节点的pod优先被删除2、pod状态pending优先于unknown优先于running被删除3、pod condition ready为false优先被删除4、pod注解pod-deletion-cost值较低的优先被删除5、同一个节点上的较多的pod,优先被删除6、如果pod都是ready,则ready时间较短的实例优先被删除,但ready时间差距较小也会认为是ready时间相同,若相同则此时会比较UID,UID小的优先被删除,可以理解为随机删除
2023-06-10 23:48:26
1591
原创 k8s之审计日志
k8s在 v1.7 版本中发布了审计(Audit)日志功能,审计(Audit)提供了时序操作记录(包括时间、来源、操作结果、发起操作的用户、操作的资源以及请求/响应的详细信息等)。K8s 中的审计日志是标准的 JSON 格式,APIServer 会根据具体的日志策略将对应的审计日志保存本地,并可以设置最大保存周期、时间、轮转策略等,一般在/var/log/kube-apiserver目录下。
2023-05-03 16:44:11
1693
原创 k8s之command、args 与 CMD、ENTRYPOINT的对应关系
Pod中command、args与Dockerfile中ENTRYPOINT、CMD的覆盖关系。具体的是 command 命令代替ENTRYPOINT 的命令行,args代替CMD 的参数。但是 并不是说 他们是一个等价的覆盖关系。
2023-04-01 11:03:22
1782
原创 k8s-List机制及resourceVersion语义
kube-apiserver 核心职责提供Restful API;代理集群组件,如dashboard、流式日志、kubectl exec 会话;缓存全量的etcd 数据且无状态服务可水平扩展。
2022-11-20 22:57:14
3639
原创 k8s之滚动更新及pod流量分析
Pod 被删除后,状态被 endpoint-controller 和 kubelet 订阅,并分别执行移除 Endpoint 和删除 Pod 操作,但是两个操作并非我们预期的先移除 Endpoint 后再删除 Pod,而是是同时进行的,因此有可能会出现在 Pod 已经接收到了 SIGTERM 信号但仍然有流量进入的情况。
2022-11-06 21:43:02
2374
原创 Golang之mysql
github.com/jinzhu/gorm 是Gorm v1的地址;gorm.io/gorm 是Gorm v2的地址;
2022-10-22 20:55:42
1744
原创 k8s之三大探针
livenessProbe存活性探针,用于判断容器是不是健康,如果不满足健康条件,那么 Kubelet 会杀死容器,并根据restartPolicy重启策略(Always,OnFailure,Never)来判断Pod 是否要进行重启操作;readinessProbe 就绪性探针,用于判断容器内的程序是否存活,如果不满足健康条件,那么会自动从Service的 EndPoint 列表中去除该pod的 IP:Port;startupProbe启动探针,k8s1.16新增,主要解决在慢启动程序或复杂程序中rea
2022-09-20 21:25:13
2543
原创 k8s之从internal version到runtime.codec
介绍k8s internal version 和 runtime.serializer 以及 runtime.codec
2022-09-03 18:28:49
537
原创 DevOps随笔
GitOps是将Git作为CI/CD流水线的核心,将应用程序和应用部署计划都存放在Git版本库中,每个开发人员都可以使用Git来加速和简化应用程序部署和运维任务。
2022-07-23 17:36:43
229
原创 k8s之删除机制
1、finalizers: 对象终结器,列表内的键为空时资源才可被删除。当我们删除带有 finalizers 字段的对象时,该对象首先会被添加 deletionTimestamp(删除时间戳)字段,并一直处于预删除只读状态(删除终结器键更新除外),直到某些控制器删除或使用 Kubectl 删除该对象终结器之前,真正的删除都不会完成,同时一旦终结器列表为空,k8s gc就会回收该对象,将其放入要从注册表中删除的队列中。2、owner references: 所有者引用,即父资源对象是谁...
2022-05-30 10:52:59
2191
1
加密算法类描述.zip
2020-08-12
基于用户的协同过滤算法py3.x
2018-05-03
简单的python创建读写文件脚本
2017-11-14
IM-fourier.rar
2020-10-26
redis+消息队列_20200728.docx
2020-07-28
大学计算机作业爬虫+matplotlib.rar
2019-06-21
元学习论文Optimization as a model for few-shot learning的简单理解_详细注释
2019-02-26
One-shot learning with Memory-Augmented Neural Networks
2019-01-21
hadoop2.6提交jar包时卡在Running job
2017-10-23
TA创建的收藏夹 TA关注的收藏夹
TA关注的人