- 博客(15)
- 资源 (1)
- 收藏
- 关注
原创 星巴克咖啡教室活动体验如何?
为星巴克咖啡教室活动随笔,回答了咖啡教室是否值得去的问题,并给出预约建议。帮助读者2分钟内了解咖啡教室时间、地点、流程、成本和体验等内容,以便作出是否参与的决定。
2022-11-13 00:01:45
1359
原创 公寓耗电异常数据分析
数据分析在租房场景中应用实例背景2021年1月6号签租房合同,1月11日入住,1月31日收到电费237.02元(183.32度电,每度1.3元)。写下公寓耗电异常分析过程,希望可以帮助租户对异常耗电进行溯源。找到省电办法,或者找到电表异常。问题在广州上月用电27度(实际12度+公摊15度),来深圳后用电飙升到183度。惊讶之余,尝试找到高耗电根源,以解决问题。疑点电表有问题,比如贴错标签;热水器功率过大,耗电太高。定位用电预估计算每天可能耗电的峰值:热水器2.5kw x 1h +
2021-02-05 01:17:26
1737
原创 Istio组件日志与请求日志采集方案
这里写自定义目录标题Istio日志方案背景说明关键问题解决方案实现思路调整范围组件日志请求日志测试流程压测目标压测过程压测结果优化方案附录参考资料Istio日志方案背景说明为方便故障定位、问题溯源和运营分析,采集istio组件日志、请求日志和业务日志是服务网格落地的重要步骤之一。默认情况下,istio相关日志打在容器内,pod销毁重建后日志消失。此外,istio日志量没有预估和分级,很可能出现日志量过大而导致k8s集群不稳定等风险。关键问题Istio默认情况下,日志易丢失、难查找和未分级,很容易出
2020-09-29 15:04:36
2876
1
原创 k8s集群yaml文件方式迁移业务
k8s集群备份脚本背景说明k8s集群迁移主要有2种:1.通过etcd mirror迁移数据; 2.通过导出k8s yaml文件。前者etcd导入的数据过多,控制精度不高。后者控制精度更高,更倾向于后者。备份脚本k8s-migrate.sh#!/bin/bash# crontab定期执行备份脚本, 每半小时备份一次.set -eu# k8s yaml文件备份路径BACKUP_DIR='/data/simple-cloud-backup/k8s'# 创建k8s yaml备份总目录[ !
2020-08-26 19:20:13
939
原创 filebeat占用 cpu和mem资源过多问题说明
filebeat占用 cpu和mem资源过多问题说明摘要用du -sh看到sql.log日志大小128M ,实际占用14G磁盘空间,文件并没有释放。filebeat处理sql.log日志异常,导致cpu和mem飙升。说明:用true时,运行的filebeat进程持有已经被删除了的文件的句柄(closed_renamed: false不会释放句柄),因此sql.log文件不会真正在磁盘中被删除,分区超级块中的信息也不会更改。用rm -f时,filebeat的close_removed:true,会释放文件
2020-08-24 16:36:53
3865
原创 Kubernetes GPU环境搭建
Kubernetes GPU 环境搭建适应场景k8s集群v1.13.0以上版本,调用GPU显卡计算资源,以支持TensorFlow,Caffe和PyTorch等AI应用。准备工作1.centos7系统上安装v1.13.0以上版本k8s集群,且服务器有nvidia显卡;2.安装nvidia显卡驱动,并确保显卡驱动版本与nvidia library的版本一致;搭建环境docker运行时更新repo源distribution=$(. /etc/os-release;echo $ID$VERS
2020-07-07 12:15:38
1022
原创 k8s-netchecker-server网络检查组件
适用场景k8s-netchecker-server网络用于检查k8s集群的网络连通性,包含宿主机物理网络和虚拟网络。结合prometheus-operator开源告警组件,能及时发出网络异常告警。使用说明在已经安装prometheus-operator监控组件的k8s集群上,直接运行deploy.sh即可部署k8s-netchecker-server网络检查组件。检查网络: curl ‘http://127.0.0.1:31081/api/v1/connectivity_check’安装脚本de
2020-06-05 16:52:20
1241
原创 安装redis shell脚本
安装redis shell脚本使用说明适应于centos7操作系统,安装单点redis部署;firewalld和iptables需开放PORT监听端口;redis密码(PAS及SSWD)和监听PORT等,可根据需要修改;该脚本应用场景为开发测试,对redis性能和稳定性的要求不高;若生产使用redis,则需找DBA选择合适的方案,如集群模式和哨兵模式等,避免redis雪崩而影响业务。redis_install.sh文件#安装redis shell脚本##0.离线环境下proxy_ip
2020-06-03 15:16:10
574
原创 服务器hostname命名规范汇总
服务器hostname命名规范背景说明目前,小组服务器的hostname没有一个标准,通常情况是沿用云机ID。若遇到hostname都是localhost,则修改hostname会比较困惑。特别注意,hostname修改操作只针对新机器,不能动生产的服务器。因calico依赖hostname,故hostname变更会引起三层虚拟网络断开故障。推荐小规模集群hostname命名规范规则: U...
2020-03-06 11:49:39
12146
原创 生产级别Dockerfile制作过程
因公司推进java11版本升级(默认支持容器),故小组制作了操作系统、java8和java11基础镜像。制作过程使用了一系列优化做法,涵盖缩短构建时间、制作更小更安全镜像等问题,旨在提升构建镜像效率和质量,并使其在容器云平台上更好地运行。
2020-02-28 20:51:38
1264
原创 go安装与hey压测
Jmeter(java语言开发的压测工具)的用户体验比较好,操作简单,能生成报表数据。在用JMeter排查k8s问题时,发现java虚拟机GC的时候,会产生错误的压测结果,导致错误的判断。因此,才采用hey压测工具,进行简单的压测,以确定容器云在组件升级过程中,服务是否中断。
2020-01-21 12:21:50
1458
1
原创 calico多租户网络隔离和部分租户业务隔离方案
calico网络隔离方案摘要一.前提条件二.Ingress入口网关2.1 不同namespace间的多租户网络隔离2.1.1 创建frontend, backend, client, and management-ui 等应用2.1.2 启用隔离策略2.1.3 增加一个授权策略以允许UI应用访问stars和client命名空间中的服务2.1.4 创建一个backend-policy.yaml的授权...
2020-01-19 18:30:28
1822
原创 公积金贷款资料准备
公积金贷款资料准备背景说明适用范围材料准备背景说明本人作为一名DevOps工程师,从事容器云的开发、运维与运营工作。很多事情比排查kubernetes疑难杂症、落地istio服务网格和提升ceph读写效率更加难做,更加让人身心疲惫。比如办理公积金贷款证明来,需要准备很多资料。特别说明,公积金贷款的利率非常低,甚至比招行3年定期的利率还低,比商贷划算很多。因去跑各个政府机构非常的耗时耗力,故在此...
2020-01-19 16:36:23
210
visual-demo.zip
2020-01-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人