- 博客(350)
- 资源 (31)
- 问答 (5)
- 收藏
- 关注

原创 《Cloud Native》云原生技术汇总
An awesome & curated list of best applications and tools for Cloud Native. This Awesome Repository is highly inspired from cncf’s landscape & Awesome. Items marked with ![Op...
2018-03-23 14:32:23
7584
转载 AWS-什么是站点可靠性工程(SRE)?
可观察性过程是指当软件为最终用户投入使用时,软件团队为不确定性所做的准备。站点可靠性工程 (SRE) 团队使用工具来检测软件中的异常行为,更重要的是,收集有助于开发人员了解问题原因的信息。可观察性涉及使用 SRE 工具收集以下信息。监控是指在应用程序中观察预定义指标的过程。开发人员决定哪些参数对于确定应用程序运行状况至关重要,并在监控工具中进行设置。站点可靠性工程 (SRE) 团队收集反映系统性能的关键信息,并在图表中进行可视化。在 SRE 中,软件团队监控这些指标,以深入了解系统可靠性。
2023-12-01 23:21:19
376
原创 SRE-架构框架-可靠性
对于面向用户的工作负载,请衡量用户体验。用户必须对您的服务的表现满意。例如,衡量用户请求的成功率,而不仅仅是查询 CPU 使用率等服务器指标。对于批量和流式工作负载,您可能需要衡量数据吞吐量的关键性能指标 (KPI),例如每个时间窗口扫描的行数,而不需要衡量服务器指标,如磁盘使用率。吞吐量 KPI 有助于确保用户需要的每日报告或季度报告按时完成。本文档是由两部分组成的系列中的第 1 部分,其中介绍了运营在线服务的团队如何使用服务等级目标 (SLO) 开始构建和采用站点可靠性工程 (SRE) 文化。
2023-12-01 19:21:56
1950
原创 SRE体系建设指南
拥抱风险:容忍风险、度量风险、管理风险、研究当前高频故障原因和主要风险;演进式、SLO目标内允许故障工作准则:专注改进设计、专注研发工作;把可靠性工作纳入软件各阶段、简单化、减少琐事。
2023-11-29 17:47:34
1673
原创 架构实战关键知识点
24.Istio:https://istio.io/latest/docs/concepts/what-is-istio/华仔的 Pipeline 项⽬代码: https://github.com/yunhua-lee/arch-training。38.Reactor 事 件 响 应 :https://docs.oracle.com/javase/7/docs/api/java/nio/channels/Se lectionKey.html。
2023-10-11 16:14:53
771
原创 稳定性技术保障
常规高可用解决方案往往是基础架构层面的,应对突发流量通过增加资源供给的方式解决,不过这种基础架构的弹性效率是有能力上限的,同时某些自身应用模块出现的问题也会导致整个应用的严重故障。多活容灾MSHA(Multi-Site High Availability),是在阿⾥巴巴电商业务环境演进出来的多活容灾架构解决⽅案,可以将业务恢复和故障恢复解耦,有基于灵活的规则调度、跨域跨云管控、数据保护等能力,保障故障场景下的业务快速恢复,助⼒企业的容灾稳定性建设。1.1.2.2.混沌工程实践指南(2021年)
2023-05-04 09:31:22
3376
原创 运维开发工程师(BKDS)理论基础
运维开发工程师(BKDS)理论基础蓝鲸SaaS开发框架包含哪些Web防护策略?A. 防 CSRF 攻击B. 防 XSS 攻击C. 防 SQL注入D. 没有Web安全防护正确答案:A,B,C社区版如何将第三方系统放在工作台中使用?A. 社区版不支持第三方系统链接接入B. 通过修改配置文件添加第三方系统链接C. 通过PaaS平台DB管理端:domain/admin,添加“常用链接” D. 直接登录数据库,修改DB数据,添加“常用链接”正确答案:C,D以下哪些是生成器自身的方法?A.
2021-02-27 09:02:40
2433
2
原创 记录-蓝鲸相关知识点
运维自动化工程师(BKOS)理论基础运维自动化工程师(BKOS)理论基础蓝鲸安装完成后,ssh登陆到蓝鲸的机器上会自动加载一些环境变量,这些变量是定义在哪个文件A. $HOME/.bashrcB. $HOME/.bkrcC. /etc/profileD. /data/install/.rcmdrc正确答案:B蓝鲸安装过程中,会使用一个标记文件来记录安装的步骤,它的路径是A. /data/install/bk_installB. /data/install/.bk_install.st
2021-02-27 09:00:54
3022
转载 Linux中40个最佳Find命令示例
Linuxfind命令是功能强大的工具,使系统管理员可以根据广泛的搜索条件来定位和管理文件和目录。它可以按名称,类型或扩展名,大小,权限等查找目录和文件。除了查找文件和目录之外,将find命令与其他命令结合使用还可以使您对结果采取行动。添加该-exec选项后,系统管理员可以运行外部命令并执行与指定条件(例如大小,名称等)相匹配的文件的复制,移动,删除或更改权限等操作。在本文中,我们将通过示例解释基本的Linux find命令。这将向您展示如何查找文件和目录。然后,我们将向您展示如何使用该-exec选
2020-11-02 17:17:53
861
原创 Greenplum编译安装
Greenplum部署手册一、环境准备操作系统ARM-Neokylin7.6-64bit安装包 greenplum6.9.1(源码)设置语言echo "export LANG=en_US.UTF-8" >> /etc/profilesource /etc/profile编译环境yum install -y curl-devel bzip2-devel python-devel openssl-devel readline-
2020-09-18 15:06:29
2034
10
转载 ZooKeeper基本原理
ZooKeeper简介ZooKeeper是一个开放源码的分布式应用程序协调服务,它包含一个简单的原语集,分布式应用程序可以基于它实现同步服务,配置维护和命名服务等。ZooKeeper设计目的1.最终一致性:client不论连接到哪个Server,展示给它都是同一个视图,这是zookeeper最重要的性能。2.可靠性:具有简单、健壮、良好的性能,如果消息m被到一台服务器接受,那么它将被所有的服务器接受。3.实时性:Zookeeper保证客户端将在一个时间间隔范围内获得服务器的更新.
2020-07-27 20:03:59
632
原创 最有用的Linux命令行技巧
最有用的Linux命令行技巧将输出显示为表格mount | column –t使用-s参数指定分隔符,如下cat /etc/passwd | column -t -s:重复执行命令,直到命令成功运行使用while true循环,>/dev/null 2>&1 将程序的输出重定向到/dev/null,同时包括标准错误和标准输出。按内存使用情况对进程进行排序ps a...
2020-03-22 10:17:17
1266
原创 四步搞定ansible-tower
四步搞定ansible-tower环境准备centos7 + 2c/G (笔者测试)step1 下载ansible-tower最新版wget https://releases.ansible.com/ansible-tower/setup/ansible-tower-setup-latest.tar.gzstep2 解压tower到opt下,并配置初始密码tar zxvf an...
2019-09-09 09:32:07
3543
2
原创 centos7安装配置prometheus
centos7安装配置prometheus更新系统&禁用selinuxyum update -ysed -i 's/SELINUX=enforcing/SELINUX=disabled/g' /etc/sysconfig/selinux#reboot 下载prometheus安装包去官网下载地址下载相关软件包:https://prometheus.io/download/...
2019-08-20 15:09:40
5661
3
原创 centos7 安装netdata及使用
netdatanetdata简介构建最佳的实时健康监控和性能故障排除解决方案netdata官网:https://www.netdata.cloud/aboutnetdata文档:https://docs.netdata.cloud/netdata安装参考:https://docs.netdata.cloud/packaging/installer/#install-netdata...
2019-08-19 19:39:58
4028
3
转载 【备用】常用镜像源
阿里镜像:https://opsx.alibaba.com/mirrorgooglekubernetes源: https://hub.docker.com/u/mirrorgooglecontainers/企业贡献:搜狐开源镜像站:http://mirrors.sohu.com/网易开源镜像站:http://mirrors.163.com/阿里云开源镜像站:http://mirrors....
2019-07-02 10:38:49
1076
原创 kubenetes 1.15.0 安装脚本
k8s 安装脚本#!/bin/bash# command from office website (https://kubernetes.io/docs/setup/production-environment/tools/kubeadm/install-kubeadm/ && other place# config aliyun k8s reposetup_k8s_re...
2019-07-01 18:09:03
928
原创 k8s常见报错解决--持续更新
k8s 常见报错处理[WARNING IsDockerSystemdCheck]: detected “cgroupfs” as the Docker cgroup driver. The recommended driver is “systemd”. Please follow the guide at https://kubernetes.io/docs/setup/cri/error...
2019-07-01 15:33:14
15921
1
转载 一文带你读懂CNCF Landscape
转自:https://www.kubernetes.org.cn/5482.htmlCloud Native Computing Foundation,云原生计算基金会(以下简称CNCF)是一个开源软件基金会,它致力于云原生(Cloud Native)技术的普及和可持续发展。云原生技术是通过一系列的软件、规范和标准帮助企业和组织,在现代的动态环境(如公共云、私有云和混合云)中构建和运行敏捷的、...
2019-06-15 22:43:20
1505
转载 解码平安:如何成为世界级综合金融集团
文 :恒大研究院 任泽平 曹志楠 解码平安2.mp3 来自泽平宏观 00:00 06:08 导读 平安成立至今30年,从一家地方性保险公司成为世界级金融集团,位列世界500强第29位,市值跻身A股前5,背后有何成功基因与发展逻辑? 摘要 平安发展三十年,从地方性保险公司成长为全国性综合金融集团,目前向国际个人金融生活服务提供商迈进。平安1988年诞生于深圳...
2019-06-07 08:24:56
5370
转载 GC 调优实战
原文:https://yq.aliyun.com/articles/54413前情概要对于线上高并发、高吞吐的Java web服务来说,长时间的GC暂停(也叫 stop- the-world)会严重影响系统吞吐、稳定性和用户体验。下文是我们的一个真实线上web系统针对GC调优过程的一个总结。这个系统在调优前,经常会反映有超秒的GC暂停问题,这种GC问题可能会导致调用方(可能是上层服务调用方...
2019-03-16 17:44:35
878
原创 glusterfs中split-brain修复
gluster环境参考https://blog.youkuaiyun.com/wh211212/article/details/79412081ovirt 中国glusterfs服务脑裂恢复查看脑裂情况gluster volume heal gv0 info split-brain恢复脑裂# 制定brick恢复gluster volume heal gv0 split-brain ...
2019-02-27 20:18:34
1269
原创 java线上服务问题排查总结
java线上服务问题排查1、业务日志相关如果应用系统出现异常,一般都会在业务日志中体现统计当天业务日志中ERROR出现数量:egrep ERROR --color logname | wc -l ,如果错误数量过大,一般都是有问题的查看日志中ERROR后10行具体报错:egrep -A 10 ERROR logname | less ,或 -C 10 查看ERROR前后10行日志...
2018-12-06 22:51:46
1996
原创 CentOS7上静默(silent)模式安装Oracle12C Release 2 (12.2)
CentOS7上静默(silent)模式安装Oracle12C Release 2 (12.2)参考:http://dbaora.com/install-oracle-in-silent-mode-12c-release-2-12-2-on-oel7/安装依赖虚拟机环境:http://dbaora.com/install-oracle-linux-7/oracle下载:http://...
2018-09-20 14:46:58
3961
1
原创 ansible-playbook调用zabbix-api自动添加主机
ansible-playbook调用zabbix-api自动添加主机playbook-example# example.yml---- hosts: "{{ host }}" vars: zabbix_host_groups: "{{ host }}" zabbix_url: "http://zabbix.example.com" zabbix_api_u...
2018-09-18 20:20:26
2184
原创 不得不学的Markdown语法
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Ma...
2018-09-18 20:04:14
514
原创 shell处理用户输入总结
处理简单选项#/bin/bash# extracting command line options as parametersechowhile [ -n "$1" ]do case "$1" in -a) echo "Found the -a option" ;; -b) echo "Found the -b option" ;; -c) echo ...
2018-08-20 08:09:36
613
原创 shell批量设置免密认证
shell批量设置免密认证 实验背景:笔者想使用ansible同步一批虚拟机的配置,需要对这些虚拟机进行免密设置实验所需文件及脚本如下图 生成ip列表#!/bin/bash##################################### Function: generate ip list for use#####################...
2018-07-12 09:36:41
1872
原创 mysql 恢复单表数据
mysql 恢复表数据table A从全库备份中抽取出t表的表结构sed -e '/./{H;$!d;}' -e 'x;/CREATE TABLE `A`/!d;q' DB.sql > A.sql (表结构)从全库备份中抽取出t表的内容grep 'INSERT INTO `A`' DB.sql > A.sql到测试库上恢复# 创建...
2018-07-11 11:48:25
2591
原创 CentOS7最小化安装后初始化脚本
centos7 初始化脚本#!/bin/bash################################################## --Info# Initialization CentOS 7.x script################################################## Auther: shaonb...
2018-07-11 10:39:11
1677
原创 在CentOS/RHEL7上禁用IPv6
在CentOS/RHEL7上禁用IPv6在内核模块中禁用IPv6(需要重启)使用sysctl设置禁用IPv6(无需重新启动)在内核模块中禁用IPv6编辑/etc/default/grub并在行GRUB_CMDLINE_LINUX中添加ipv6.disable = 1,如下:# cat /etc/default/grubGRUB_TIMEOUT=5GRUB_DE...
2018-07-11 10:27:30
1629
原创 KVM虚拟机导入到ovirt平台
KVM上虚拟机迁移到 ovirt实验环境kvm宿主机:192.168.0.201ovirt平台:https://ovirtengine.aniu.so,ovirt节点192.168.0.123kvm宿主机开机远程tcp连接安装完libvirtd,默认tcp连接没开,需要手动开启[root@sh-kvm-2 ~]# virsh list --all Id ...
2018-07-09 20:24:45
4414
原创 CentOS7快速安装rancher2.0环境
快速安装rancher环境指南准备linux主机A cloud-host vm内部部署VM裸机(物理机) 使用云托管虚拟机时,需要允许到端口80和443的入站TCP通信。根据以下要求配置主机Ubuntu 16.04 (64-bit)Red Hat Enterprise Linux 7.5 (64-bit)RancherOS 1.3.0 (64-bit)...
2018-07-05 19:51:29
19587
原创 CentOS7上利用packstack快速部署OpenStack Queens测试环境
CentOS7上利用packstack快速部署OpenStack Queens测试环境环境vm centos7 16G 4 vcpu由Packstack快速构建Openstack All-in-One环境。仅限于CentOS 7 Base和Openstack Queens Repo以及EPEL Repo和Packstack软件包。其他软件包由Packstack自动安装和配置。...
2018-06-29 15:56:11
11212
1
原创 CentOS7安装IT资产管理系统Snipe-IT
CentOS7安装IT资产管理系统Snipe-IT介绍资产管理工具Github:https://github.com/snipe/snipe-it官网:https://snipeitapp.com/Demo:https://demo.snipeitapp.com/安装要求系统要求(https://snipe-it.readme.io/docs/requireme...
2018-06-26 13:43:48
25228
16
原创 CentOS7安装使用svn
CentOS7安装使用svn安装版本控制工具Subversion安装Subversion[root@vm-06 ~]# yum -y install subversion创建一个存储库。例如,笔者这里创建“/var/svn/repos/project”[root@vm-06 ~]# mkdir -p /var/svn/repos/project [root...
2018-06-26 13:40:53
887
原创 五分钟轻松运维管理ECS(elastic compute service)
使用云服务器的好处ECS概念使用ECS快照功能恢复误删数据性能监控,自动告警
2018-06-13 18:20:18
4484
原创 CentOS7 postgresql安装与使用
CentOS7 postgresql安装与使用安装配置postgresql# 安装[root@vm-06 ~]# yum -y install postgresql-server# 初始化[root@vm-06 ~]# postgresql-setup initdb Initializing database ... OK# 设置postgresql可被远程连接登录[r...
2018-06-12 15:59:37
8662
原创 HTTP协议基础学习
理解Web请求流程web请求流程概述 B/S网络架构和请求流程概述理解HTTP协议的相关元素HTTP协议 HTTP消息头 HTTP请求OPTIONS:返回服务器针对特定资源所支持的HTTP请求方法。也可以利用向Web服务器发送'*'的请求来测试服务器的功能性。 HEAD:向服务器索要与GET请求相一致的响应,只不过响应体将不会被返回。这一方法可以在...
2018-06-08 11:51:11
854
SRE体系建设指南2023
2023-11-29
运维团队成熟度评估模型
2023-10-11
netdata-1.6.0
2017-03-22
ITIL-V3-Foundation-培训专用资料.pdf
2017-01-23
阿里云产品V5.0
2016-10-13
jvm 参数优化多少合适?
2017-03-09
redis命中率优化解决方法
2016-10-18
linux下通过命令打包java程序和eclipse导出java程序的war有什么区别?
2016-10-18
java程序如何在linux打成war部署到tomcat下?
2016-10-18
redis命中率优化解决方法
2016-10-12
TA创建的收藏夹 TA关注的收藏夹
TA关注的人