- 博客(226)
- 资源 (58)
- 收藏
- 关注

原创 软件从业人员七大问
本人是个从事软件行业十几年的老鸟,想通过本篇博文跟大家分享一些关于职业规划和求职面试方面的经验,同时本文也将会参加优快云“裁员与面试” 主题征文活动,如果对大家有帮助喜欢可以多多点赞并留下您宝贵的意见,谢谢。第一问:软件研发职业寿命有多长?“程序员就是青春饭”,“某某企业员工被裁员后跳楼”,“经济寒冬降至,互联网巨头相继大范围裁员”对于软件开发工程师,圈内圈外的人群可能或多或少都会受到...
2019-03-19 19:22:08
1417
2
原创 叶工好容7-Ingress的由来
吃透一个技术,不仅要掌握详细的用法能够熟练的操作,更需要掌握技术出现的前因后果。不会平白无故创造一种技术,技术的产生是为了解决现有痛点的。本篇就一起来看下ingress出现的前因后果。
2024-04-30 18:45:50
666
原创 混沌工程-经典案例分享
混沌工程是一种产生新数据的技术,通过演练不仅能提前发现隐患避免故障的大范围爆发,还能发现运维体系的盲区和整体架构设计的缺陷,可以说混沌工程本身就是优秀架构设计的试金石。
2024-03-06 18:09:03
1186
原创 运维体系中的那些Ops们
提到运维,自然而然会联想到DevOps,大家应该还听说过DataOps、GitOps、DevSecOps、AIOps等,这么多的XXOps到底都是啥意思,他们又是因为什么而存在并发展起来的呢? 本文讲一一为大家进行解答。
2024-01-16 20:15:23
1365
原创 10条公有云省钱攻略
科技就是力量,知识就是金钱。云计算给我们带来了算力和系统架构上革命性质的提升,通过资源规模层面的整合可以达到节约成本的效果,但是如果不具备相关的领域知识反而会造成大量的浪费。本文将从具体的细节为突破口,分享一些公有云使用过程中的省钱攻略
2023-11-23 18:01:06
296
原创 叶工好容6-自定义与扩展
本篇主要介绍扩展的本质以及CRD与Operator之间的区别,帮助大家理解相关的概念以及知道要进行扩展需要做哪些工作。
2023-10-01 09:40:43
587
1
原创 多语言gRPC开发入门与避坑指南
本文用java实现了gRPC服务端,然后分别用java、go、python来调用,只给了“一来一回”同步函数式调用,其实gRPC支持4中调用方式,真实情况比复杂的多。但比起对接gRPC来说,开发环境的准备更复杂,坑也很多,希望通过本篇博文能把gRPC开发所有步骤和需要注意的地方都解释清楚。
2023-08-04 20:10:20
661
原创 叶工好容5-日志与监控
运维体系中的日志和监控是个频率很高的知识点,日志如何采集和收集?监控如何采集和收集?运行在容器云中的监控与云实例中的监控有什么本质区别?本篇将为大家解读这些概念并对当前主流工具进行简单介绍。
2023-07-28 18:55:12
496
原创 叶工好容4-Event机制
k8s的event是一个有用且容易被忽视的一种资源,本文将主要分析下event是什么,以及如何利用event来维护我们的k8s平台。
2023-06-29 15:46:28
205
原创 叶工好容3-云原生DNS解析
虚拟化只解决了网络上寻址的问题,只能定位到IP,但成千上万个动态的IP对于我们直接使用是没有任何意义的,我们必须借助有意义的“标识”信息做一次到IP的映射才可以,而常用的“标识”就是域名。
2023-06-28 12:13:19
978
原创 叶工好容2-云原生网络
IT行业中网络技术本身就是最枯燥但又最复杂的一块,kebernetes用到的这些虚拟网络技术更是难上加难,许多知识点容易记混淆,或者说能背过概念但不清楚它出现的前因后果和应用场景,本篇博文会按照底层协议->上层技术->顶层框架的顺序来为大家好好分享下云原生网络的基本概念,帮助大家形成框架式的知识结构。
2023-05-10 17:35:33
906
2
原创 Centos内核升级解决eBPF脚本问题
最近在进行eBPF相关的尝试,在centos7中执行eBPF脚本时遇到如下错误,从网上找到原因,是因为kernel和kernel-devel工具版本不一致导致的。
2023-02-22 19:05:01
1662
原创 Vault的程序侧接入方式-AppRole
程序侧的接入对于Vault来说也是一种Accessor的接入,而AppRole绝对不是Vault首推的程序侧接入方式,但它是最方便的接入方式。
2022-12-31 19:13:05
1597
原创 Vault-如何与运维体系融合
上一篇《Vault-敏感信息保护的一种大胆尝试》介绍了解决运维体系中安全问题的一个基石地位的平台Vault,本篇跟大家分享下Vault如何与运维体系集成和联动。
2022-11-07 10:09:45
1644
原创 Vault-敏感信息保护的一种大胆尝试
Vault对所有的模块都是以插件化的方式提供好了接口和规则,并内置了一些常用插件的实现,这种设计跟Terraform和Packer一样,很符合HashiCorp的气质。从产品的生命周期和灵活度来考虑,个人觉得是个很有潜力的产品。
2022-09-06 11:37:47
1575
原创 混沌工程-自动巡检前的阵痛期
混沌工程是推动监控体系完善的动力和方向,换句话说凡是混沌需要关注的指标就是有意义的指标,所以为了解决上述问题我们必须把这些指标数字化并纳入监控体系。对于用户行为此类复杂的指标设计在DataOps体系中不难找到标准答案,但对于混沌工程来说痛苦的点在于如何确定这些指标的结果是正确的?...
2022-07-11 18:43:29
312
原创 混沌工程-故障工具的安全问题
前言: 影响混沌工程进入生产环境的两大阻碍,我们前篇已经详细分析了第一个阻碍“最小爆炸半径”,本篇我们详细分析下第二个阻碍“故障工具的安全问题”。故障工具: 混沌工程的核心之一是故障演练,而模拟故障的组件就是所谓的故障工具。目前国内最好的故障工具应该是阿里开源的ChaosBlade,它可以覆盖到系统和网络层面大部分的演练场景,而且对容器云也有很好的支持。更详细的ChaosBlade的介绍请参考这里https://github.com/chaosblade-io/chaosblade/...
2022-05-27 11:44:57
1456
原创 混沌工程之-最小爆炸半径
自混沌工程理念提出来之后,追随者甚多,实践者甚少,这是为什么?因为混沌工程是把双刃剑,稍不留神就会弊大于利,所以大家对混沌工程,特别是生产环境的混沌工程是慎之又慎。本篇将围绕最小爆炸半径提出3个问题,并给出自己的一些解法。混沌工程可直接在生产环境进行么? 混沌工程的五大原则中有一条“在生产环境中进行试验”,混沌工程五级成熟度也把混沌实验的环境(预发布、灰度、生产)作为了评判标准之一,所以这个慢慢趋于生产的递进过程也就成为了行业大部分混沌工程推广的潜规则了。 其实这里面我个人觉得我们...
2022-04-02 18:13:39
2700
原创 混沌工程-为什么推广的如此困难
前言 2019年开始接触混沌工程,2020年开始我们的运维体系开始引入混沌工程相关的设计,2022年准备正式在生产环境落地。期间走过不少弯路,基本是摸着石头过河,该犯的错误犯过之后我们对自己混沌工程的前景充满信心!本篇博文想着重介绍下,混沌工程大家都或多或少有所了解,火了也有几年的时间,为什么能落地生产的还是寥寥无几,混沌工程的推广为何如此困难呢?五大原则 混沌工程的提出者给出了五大原则,很好的给我们指明了目标和方向,在项目中一切设计的准绳都必须围绕这五大原则,一旦偏离其中一个原则就...
2022-02-15 20:07:20
1216
原创 教你如何选择一家靠谱的云厂商
1 成本 这里的成本分为对内和对外两部分。对外,也就是企业总共需要支付给云厂商的费用;对内,是企业内部费用分摊的问题。对外肯定是越便宜越好,这个也包括3个方面。1、公有云的报价 2、商务合作与折扣 3、合理的使用方式。这里重点解释下使用方式,以云实例为例,如果厂商A只有包月、按量两种收费模式,厂商B有包月、按量、预留实例券、竞价四种模式,在单价相差不大的前提下要优先选后者,因为在某些场景下可以利用预留实例券和竞价为我们节省大量的经费。2 稳定性 稳定大于天,这个是对公有云最重要的要...
2021-11-18 19:46:52
598
原创 BPF相关技术与发展史
BPF本质上是一种操控内核的开发技术,所以要彻底明白BPF就要先了解内核的相关知识。Linux两大运行空间 CPU将指令分为特权指令和非特权指令,对于那些危险的指令,只允许操作系统及其相关模块使用。操作系统的核心是内核(kernel),可以访问受保护的内存空间和硬件设备,也就是能执行这些特权指令,而用户进程不能直接操作内核,只能执行非特权指令。 出于内核安全方面的考虑,操作系统将虚拟地址空间划分为两部分,一部分为内核空间,另一部分为用户空间。通过区分内核空间和用户空间的设计,...
2021-10-11 19:51:02
555
原创 http流量分级处理机制
需求:当后端服务能力不足时我们希望尽可能为更多优质用户请求提供服务相应,放弃部分劣质请求,待峰值回落或后端扩容后再无差别对待。前提条件:监控(观察)必须要有完备的监控体系能及时发现流量的波动,并能推算出后端剩余的服务能力。网关(控制)必须要有统一的流量入口用于访问统计和访问控制。模块划分:各个模块的作用:网关:流量入口,统计request,控制response。由于网关是高并发、低延时的应用场景,所以对于流量限制部分的判断一定要低运算、短链路,所以限制条件等已经要在网.
2021-09-10 11:38:54
388
原创 为什么没人开发公有云计费平台?
随着云计算思潮根深蒂固,越来越多的企业已经上云,其中公有云因易用、持续迭代、稳定等优势占据了云市场的大头。那么有个问题随之而来-你们是如何与公有云厂商进行对账的?虽然公有云的账单系统都已经做的非常完备,但对公有云的账单绝对不是下馆子看菜谱点菜付钱那么简单,小企业靠人力还是有可能对的清,大企业上千万的账单会直接把人劝退。我个人觉得目前还没有出现一款计费平台的原因有两点。原因一是基于我们对云厂商的信任(支付宝、微信支付都是阿里腾讯的,我们还信不过他们的云平台计费系统?),原因二是自建个对账系统是个超级复杂的
2021-07-20 18:47:30
853
1
转载 「芒果TV」叶静涛:芒果TV的Spinnaker多云持续交付实践
亚太内容分发大会暨CDN峰会一直致力于推动CDN产业深度融合发展和市场普及,现已成为亚太地区影响力最大的内容分发网络盛会。十年来,在以阿里云、网宿科技、腾讯云等亚太CDN产业联盟成员孜孜不辍的努力下,CDN产业已经成为基础性设施网络,以坚定的基石之姿,支撑起中国成为世界最大的互联网市场。随着全球数字化、“一带一路”战略的推进,亚太内容分大会暨CDN峰会的影响力正在逐渐向全球延伸,同时也将中国智造CDN及产业链推广向全球每一个角落。在6月10日上午举办的【内容出海论坛】上,芒果TV运维研发负责人
2021-06-22 14:49:00
547
原创 Spinnaker微服务如何自建
Spinnaker采用了微服务体系,而对于整套微服务体系的搭建官方是推荐采用halyard来搭建的。Halyard对于spinnaker的黑盒使用者比较友好,把对spinnaker的安装、部署、配置、管理等都封装成命令(其实命令也是够复杂的),但对于具有研发基础或者说对于spinnaker比较了解的人来说这种方式有点本末倒置了,本篇在原理上介绍下如何绕过halyard自己搭建spinnaker的微服务。从原理上来讲spinnaker分为“软件包启动”和“源码启动”,从运行环境来讲spinnaker部
2021-06-03 19:47:32
479
原创 2021-我之云原生
在云原生领域不知不觉干了3年,又到了需要总结和重新规划的时候了。知识梳理首先给自己做了画像:绿色部分是自己在这个领域一直从事的工作,掌握的比较扎实的部分,其中加粗的部分自认为是专家了。蓝色部分是一直接触但还没机会开发相关产品的部分,对这些模块有一定了解但并不精通。红色部分是盲区,只是略懂皮毛。我觉得云原生领域可以有盲点但不能有盲维,后续要加强存储和安全方面相关的学习。AIOps or DevSecOps?Devops下一步有两个分支:AIOps和DevSecOps,虽然我有.
2021-04-30 17:24:43
286
3
原创 一次因阿里云API引发的Spinnaker故障
这是个真实的事故:2021/02/22 节后第一个星期一中午的准午餐时间,节后综合症导致的吊儿郎当的神经还未绷紧,突然办公室内全面报警,很多服务都出现或多或少的异常,大家不约而同地说“我去,我的服务里阿里云的机器没有了”!!。我的直觉告诉我这种批量操作不可能是误删,应该是程序或脚本引起的,赶紧联系阿里云审计日志中查下操作账号和源IP。结果是spinnaker账号在公司内网发起的请求。因为spinnaker的版本最近没有变动过,所以我第一反应没有怀疑spinnaker而是怀疑鉴权泄露了,立马修改了AP
2021-03-02 20:02:30
526
原创 自上而下面向能力的编程思想
前言: 行业里对码农的描述有很多种抬头:研发、开发、工程师等,我个人觉得描述最准确的应该是“工程师”,因为软件产品的开发本来就是个工程学的问题,只不过软件工程和土木工程的施工过程是正好相反的。土木工程是自下而上,先把地基搞好再一层层往上建设;软件开发是自上而下,先搭建空中楼阁,下面是怎么实现的并不重要。新概念: 我们都接触过很多编程思路的名词,面向对象、面向过程、面向服务等,其实做为一个软件工程师最应该具备的是“面向能力编程”。面向能力编程是软件架构和开发时的一种方法论,只关注自己需要实现的..
2021-02-19 10:56:49
773
原创 Spinnaker的Clouddriver如何支持Istio
目录实现思路需要扩展的类型核心代码KubernetesApiGroupKubernetesKindKubernetesKindPropertiesKubernetesHandler效果图:deploypatch更复杂的类型Spinnaker的clouddriver对kubernetes支持本质是将UI入参转化到代码最终转换成本地kuber命令来实现的,因为其是通过“白名单”的策略来实现的,所以对k8s的支持比较有限,不在白名单内的资源类型是无法被spinna.
2021-01-22 19:30:17
494
原创 你好,2021
现在是2020年最后一个小时,由于工作原因我已经很静没有陪伴家人一起庆祝过新年了。现在的我一边盯着监控大盘,一边听着时间的朋友,一边用键盘把今年零零碎碎发生的事情总结成博文。其实精彩的人生不正是如此么?做好当前该做的事、了解别人在做的事和社会发展的总趋势、力所能及的帮助别人变成后来者的肩旁。做好该做的事世界不缺梦想家,缺的是实干家。同样一件事,抛开技术实力上的差距不说,为什么有的人能干好,有的人干不好,核心区别在于100分定义在哪里。比如开发一个产品,有些人的100分是能用就行,有些人的100分是稳
2021-01-01 00:01:17
302
1
原创 双十一提前是不得已而为之?
做为一个650学时的得到铁粉,最近在听罗辑思维启发俱乐部第18期节目《什么叫场景》的时候听到了罗胖关于今年天猫双十一为何提前到11月1日的讨论,从而引发了一些思考。双十一提前,罗胖给出了不同的观点。一种观点认为这样是不对的,好不容易创造出了双十一这个日子,大家把消费欲望集中在一天进行释放。这是一个多好的场景塑造啊。而现在变成了持续十天的活动,这是对场景的稀释。一种观点认为这是产品的另一种演化,就像春节,前后就演化出了一个“小年”一个“元宵节”,这是围绕消费演化出了一个“附属场景”。说实话第二
2020-12-29 18:26:40
330
转载 中国SaaS和Salesforce的差距到底有多大?
来源 / ToB行业头条 (ID:wwwqifu)作者 / 黄允聪 · 编辑 / 李晓松 瑞雪前几年,Salesforce的成功激发了国内很多企业和资本的跟进,大家都觉得SaaS可以改变中国B端软件行业的困境。毕竟美国C端和B端平起平坐,而中国C端独大,大家都认为中国B端有着无限的商机。最近,Salesforce市值突破万亿超过老牌B端公司Oracle,瞬间就有媒体撰文认为这是SaaS模式的胜利。可我们想问的是,美国市场的成功能够适用中国市场吗?中国SaaS和Salesforce的差
2020-12-28 16:33:02
675
3
原创 应届求职宝典-在校准备
1 基本要求 掌握一门编程语言 Go:当下最时髦语言,云原生和区块链方向的主语言,对无编程基础的新人来说入门门槛较高。 Java:最流行应用最广泛的后端语言,十几年的发展史经久不衰,人才缺口较大。 JavaScript:前端开发已被JS一统天下,随着移动端的兴起JS又迎来新的热度。你可以不精通,但不能读不懂。 Python:入门门槛低,万能又万万不能的语言,应用于所有场景但每种场景下都不是最优选择,推荐作为第二语言来掌握。2 知识进阶 2.1数据结构: 对...
2020-12-11 11:26:52
201
原创 应届求职宝典-面试相关
1 如何准备简历 简历是敲门砖,一份好的简历是成功的一半,因为90%的简历都会被用人单位淘汰掉。作为应届生,简历的作用只有一点:获取用人单位的注意。留给别人看你简历的时间捕获超过10秒钟,所以一定要把自己最有竞争力的内容放在最显眼的地方。 用词要小心:用词避免太浮躁,作为应届生不要使用“精通”,慎用“熟练”,既要实事求是,又不能妄自菲薄。 项目经验:项目复杂度最高、自己最有把握的项目优先写在前面,换句话说你最想面试官看到或者面试你哪个项目就放在最前面。 技术栈:主流技术和自己有把握...
2020-11-24 19:54:19
254
原创 应届求职宝典-薪酬计划与发展
1 薪资组成 一般分为固定薪资和浮动薪资。 固定薪资:确定会拿到通过周期性方式发送的薪资。一般包括月薪、十三薪、补助津贴等。 浮动薪资:不确保能拿到或者只能拿到一部分的薪资,一般包括绩效奖金、年终奖、优秀个人或团队奖励等。 不同企业薪资组成和比例略有不同,例如月工资+绩效奖+年终奖=package,三部分比例是5:3:2,所以谈薪资时一定要问好package是多少。2 考核标准 考核要素很单纯,包括质量和效率。 质量:功能实现的越全越好,Bug出现的越少越好,不要被测试团队...
2020-11-17 19:06:50
257
1
原创 应届求职宝典-行业及岗位相关信息
目录前言:岗位介绍工作内容技能要求立足之本是一门语言软件思想核心是编程思维抽象能力建模能力数据结构空间想象能力持续学习能力适合的专业前言: 前段时间参与一个很有意思的活动,回忆下自己刚参加工作成为一名国荣的程序员时的状态,然后把自己从应届生到工程师中间的转变过程记录下来,分享给未来的应届程序员。个人觉得这个活动很有意义,我们以前可能过多的从技术上从前沿科技上去写了大量的博文,但是忽略了学生程序员群体,所以我打算开一个专栏帮新手们指下路。本篇介绍..
2020-10-30 19:53:29
273
1
原创 腾讯云负载均衡connect reset by peer的问题
背景:基于zuul2开发的网关项目在阿里云上试运行3个月后开始在腾讯云部署,在单机测试过程中没发现任何问题,但是部署网关的实例挂在LB下每次客户端请求都会在网关层打印connect reset by peer的错误,可是客户端并没有任何感知,所以可以确定是腾讯云的lb到lb后面的机器这一段报文出了问题,具体原因是什么?为什么客户端没有感知?请见我后面一步步分析。知识准备:TCP标识:SYN(建立联机) ACK(确认) PSH(传送) FIN(结束) RST(重置) URG(紧急),一般能了解
2020-10-15 19:54:02
2111
原创 混沌工程-Netflix的捣蛋猴
前言:混沌工程这一工程学理念已慢慢被人所接受,称它为工程学是因为虽然是由国外互联网巨头netflix提出并应用到IT技术中,但是它的思想和应用场景远远超过了互联网领域,可以独立成为一个很有价值的学科。关于它理念上的介绍,网上有大量的资料,我这边就不再搬砖了,我这里只想跟大家分享实战中的一些实践经验和混沌工程架构过程中真实的感悟。核心理念:第一,混沌工程依赖优秀的系统架构混沌工程是系统架构高阶形态,它的落地需要很扎实的系统架构和配套设施,包括Devops、持续集成平台、监控、统一网关等,否则就
2020-09-23 20:46:12
783
ChaosBlade项目外部分享.pdf
2020-07-22
深度学习在线下场景的探索与实践-云栖大会.pdf
2020-07-21
集成智能接入网关APP:优化企业级移动办公网络.pdf
2020-07-21
运营商如何实现大型企业大型企业应用上用云.pdf
2020-07-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人