
运维
文章平均质量分 84
嘉为蓝鲸
与大家分享最新IT研发、运维、运营侧资讯
展开
-
ITSM运营系列——ITSM度量指标与智能报表体系的构建方法论
智能化报表体系是ITSM度量运营的主要输出形式,大模型能够通过自然语言处理和强大的逻辑推理能力,重塑报表的生成、分析以及交互方式,使其支持更精细化的运营管理。原创 2025-03-25 11:49:37 · 962 阅读 · 0 评论 -
银行 SRE 转型新突破:依靠与虚拟 IT 组织的高效协作
本文深入探讨了SRE团队与这些虚拟组织的协作框架,分析了每个委员会的职能与目标,并阐述了SRE团队如何与它们紧密配合,推动系统的高可用性和弹性。在银行的IT运维体系中,SRE团队与其他虚拟组织(如技术架构委员会、业务连续性委员会、风险管理委员会)之间的协作不仅体现在组织层面的协同工作,还体现在人员角色的交叉与重叠上。原创 2025-03-17 15:37:45 · 830 阅读 · 0 评论 -
突破银行 SRE 转型困境,SRE 与 DevOps 团队协作策略
本文通过深入分析SRE和DevOps在银行中的角色与职责,详细阐述了它们在核心协作点上的紧密配合,尤其是在自动化流程、SLO与CI/CD的结合、故障响应、性能优化等关键领域的协作。原创 2025-03-11 15:50:41 · 649 阅读 · 0 评论 -
小鲸观测助手携手DeepSeek,开启智能告警治理的无限可能
小鲸观测助手通过对告警数据的统计分析,帮助找出那些高频出现的告警,结合内置运维知识库中的最佳实践经验,为运维人员提供针对性的原因分析及优化建议,让原本棘手的告警治理工作变得轻松高效。当告警产生后,小鲸观测助手依托告警中心的辅助分析能力,解析告警对象、告警名称、告警内容等关键信息。在告警治理过程中,面对高频告警、误报以及漏报等难题。以磁盘 I/O 使用率告警这一高频出现的告警为例,能够快速识别出告警数量过多的问题和产生原因,并依托内置的运维知识库的经验,给出告警阈值配置的最佳实践以及相关优化建议。原创 2025-03-11 15:47:56 · 461 阅读 · 0 评论 -
DeepSeek爆火,OpsPilot才是最坚实的运维“底座”!
OpsPilot的火爆程度从侧面反映了AI技术的巨大潜力,而WeOps的出色表现则证明了运维在AI时代不可或缺的重要性,真正实现1+1>>2的效果。以嘉为蓝鲸推出的AI产品OpsPilot为例,它凭借强大的AI能力,不仅为客户提供便捷的AI服务,也对公司内部所有技术与业务人员提供强大的工作支撑,构建起。,大大提高了运转效率,然而随着AI的应用范围扩大,资源要求也越来越高,对AI工具本身的支撑问题也。的火爆,正驱动人工智能迈入超速迭代周期,推动AI以前所未有的速度改变着我们的生活和工作方式。原创 2025-03-03 13:48:29 · 294 阅读 · 0 评论 -
可观测产品剖析——业务监控
无论是银行证券等金融企业,还是能源交通等制造厂商,业务永远是企业内部最重要的生命线,各种复杂繁多的业务场景支撑了一家企业的生命存续,针对业务系统的运行观测成了各大企业的重中之重。业务监控旨在通过最小化用户系统的改造需求,采用更广泛的技术路径,来降低企业内部业务可观测性的建设成本,并为众多不同类型的企业提供高度适用且用户友好的业务场景可观测解决方案。与业务看板页面一致,支持用户查看任意时段的指标数据,黄金指标集中展示并根据指标告警情况进行染色处理,支持用户点击染色视图一键跳转至告警列表页,查看对应告警详情。原创 2025-01-02 11:07:56 · 749 阅读 · 0 评论 -
4 万字干货!《企业一站式可观测体系最佳实践指南(2025)》助力新质生产力!
这本实践指南就像一盏明灯,指引企业建立完善的可观测体系,使其在面对业务技术架构日益复杂、业务需求多变等挑战时,能实时掌握系统运行状态,及时发现并解决问题,避免因系统故障或性能瓶颈影响业务发展。,一站式可观测体系能够帮助企业运维团队更加精准地定位问题、提前预警潜在风险,降低故障对业务的影响,提升运维工作的整体效率和质量,并提供最佳实践经验参考借鉴。本实践指南旨在为不同行业用户提供实践方法论指导与落地实践参考,通过理论体系的梳理、方法论的总结、场景案例的深度剖析,为企业带来以下实践价值和意义。原创 2025-01-02 10:46:33 · 251 阅读 · 0 评论 -
【灾备应急管理】2024年新国标-信息系统灾难恢复规范解读
新国标的主要变化包括引入。对原有附录 A(灾难恢复能力等级划分)、附录 B(某行业 RTO/RPO 与灾难恢复能力等级的关系示例)、附录 E(灾难恢复预案框架)进行更新,同时新增附录 C(某行业信息系统需求分类示例)与附录 D(云技术灾难恢复服务示例),丰富了附录内容,为标准使用者提供更多实用的参考资料与示例,增强了标准的实用性与指导性。,更新术语定义,增加组织机构设置,修订规划设计内容,细化建设实施阶段规范,增加安全建设要求,规范运行维护管理,增加测试评价方法,以及更新和增加附录内容原创 2024-12-31 18:32:09 · 738 阅读 · 0 评论 -
可观测系列产品剖析:调用链追踪
基于实际业务流量构建不同服务的全局依赖拓扑,实现可选时间范围的单业务领域全景分析,通过拓扑节点大小、颜色差异有效分析服务流量负载及服务健康状态,支持对服务节点的下钻分析、指定时间范围内服务请求、负载、错误、耗时黄金指标,在服务内可下钻分析服务的单一接口/单一服务实例进一步故障寻址分析。每笔业务请求调用在入口服务生成请求唯一标识,当流量在下游多个服务传递时将请求唯一标识、当前节点请求标识、上游服务信息作为上下文传递,从而构建完成业务调用链路。支持一键跳转服务分析,支持下钻至调用链检索进行详情查看。原创 2024-12-18 11:28:34 · 451 阅读 · 0 评论 -
运营商实战成果!分布式架构可观测能力建设全攻略
基于实际业务流量构建不同服务的全局依赖拓扑,实现可选时间范围的单业务领域全景分析,通过拓扑节点大小、颜色差异有效分析服务流量负载及服务健康状态,支持对服务节点的下钻分析、指定时间范围内服务请求、负载、错误、耗时黄金指标,在服务内可下钻分析服务的单一接口/单一服务实例进一步故障寻址分析。此外,用户可结合实际业务场景从HTTP请求头、请求参数、cookie等获取业务特征数据完成数据埋点,在链路分析时根据指定业务特征的请求依赖关系辅助业务异常分析。应用开发或运维人员对应用性能观测有认知、有需求、会使用的企业。原创 2024-12-18 11:23:13 · 277 阅读 · 0 评论 -
嘉为蓝鲸携手东风集团、上汽零束再获信通院四项大奖
7月28日,由中国信息通信研究院主办的“2022首届XOps产业生态峰会”在北京隆重召开。本次大会以“智效赋能·价值引领,共筑XOps新蓝图”为主题,嘉为蓝鲸与各行业领域专家学者齐聚大会,就XOps体系建设风向共同探讨交流。会上,信通院重磅发布《中国DevOps现状调查报告(2022)》,东风集团DevOps能力体系构建最佳实践编入其中,并被评选为XOps业务价值领航先锋案例。...原创 2022-08-01 14:01:35 · 392 阅读 · 0 评论 -
嘉为鲸翼·多云管理平台荣获信通院可信云技术服务最佳实践
7月21-22日,由中国信息通信研究院、中国通信标准化协会主办的“2022可信云大会”在北京隆重举行。本次大会以“云赋新生算向未来”为主题,就高性能算力、算力网络、算力服务等多个维度开展讨论。会上重磅公布嘉为鲸翼·多云管理平台获选2022可信云技术服务最佳实践。...原创 2022-07-27 18:58:37 · 195 阅读 · 0 评论 -
如何避免CMDB沦为数据孤岛?
CMDB是一个较为老生常谈的问题,这一概念在很早时期就已经引入了国内,纵观运维数字化转型的整个发展过程,CMDB的建设是每个企业都必经的重要阶段。早期的CMDB往往只是为了提供运维流程的支撑,数据准确性得不到保障,运维依赖程度低,常常会出现“建而无用”等情况。然而随着数字化转型的不断推进,运维需要更高质量的数据,!那么在实际落地建设过程中,的CMDB怎么打造?企业又该如何“修炼”面向消费的运维高质量CMDB呢?本文带您一探究竟!...原创 2022-07-27 18:49:58 · 530 阅读 · 0 评论 -
分布式系统大势所趋,银行运维如何与时俱进?
分布式系统是一个硬件或软件组件分布在不同的网络计算机上,彼此之间仅仅通过消息传递进行通信和协调的系统。——GeorgeCoulouris《分布式系统概念与设计》一个分布式系统是一些独立的计算机的集合,但是对于该系统的用户来说,系统就像一台计算机一样。——Tanenbaum《分布式系统原理与范型》分布式系统(distributedsystem)是建立在网络之上的软件系统。正是因为软件的特性,所以分布式系统具有高度的内聚性和透明性。——百度百科分布式系统运维与传统运维的本质区别。...原创 2022-07-27 18:20:13 · 539 阅读 · 0 评论 -
干货分享——银行运维组织如何转向敏捷?
关于敏捷组织的定义,从外部视角来看,是指针对市场环境的变化(如技术变革、需求变化等)能够迅速整合资源并作出反应的企业组织。从内部视角来看,敏捷组织是以客户为中心,能够迅速适应变化,不断寻求和探索新技术及商业模式并改进其运作方式,可持续地为客户创造价值的企业组织。...原创 2022-06-27 14:28:12 · 290 阅读 · 0 评论 -
什么是以消费驱动的CMDB?——嘉为蓝鲸
嘉为蓝鲸以消费驱动的CMDB建设方法论作为核心,本着客户成功的理念,在项目实践中贯彻四步法的落地过程,强调以管理体系构建作为开端,以持续运营改进作为终点,其中暗合PDCA循环的理念。嘉为蓝鲸为客户提供全过程的规划咨询、蓝图设计、产品实施、运营改进服务,确保每一个CMDB项目都能取得成功。...原创 2022-06-09 16:17:36 · 290 阅读 · 0 评论 -
AIOps是如何在腾讯IEG体系化推进和普及的?
10月,由嘉为科技携手腾讯蓝鲸智云联合主办的智慧生长·研运未来暨2021年研运治理实践大会在北京成功召开。在20日下午进行的智能化运维分论坛上,来自腾讯IEG技术运营部的蓝鲸AIOps负责人盘隆同与会嘉宾探讨了AIOps在蓝鲸的实践思路和路径,并带来了《AIOps如何在腾讯IEG体系化推进与全面普及》的专题演讲。运维领域,没有企业不在谈AIOps和如何建设AIOps,但是很多企业会缺少深度思考:AIOps的建设去向何方?以什么样的模式来建设?需要具备哪些基础能力?以及最为重要的是:我们的组织如何准备原创 2021-11-21 12:00:16 · 1754 阅读 · 0 评论 -
一文说清DevOps与敏捷的区别与联系
如果要讨论敏捷和DevOps之间的区别与联系,首先看一下他们产生的背景。在软件开发的整体流程之中,存在着很多环节,这些环节之间,也都存在着很多障碍。如图所示,在客户/用户、业务部门、开发部门、运维部门之间,都有各自不同的工作目标。对于客户/用户而言,他追求的目标就是降本增效。无论是ToB还是Toc类产品,他们都希望产品使自己的业务或者生活越来越好,客户追求的是价值至上的原则。对于业务(或者是商务)部门而言,他们的目标是快速满足客户需求,然后增加营收。所以业务部门或者商务追求的是市场文化,这种原创 2021-10-28 17:17:24 · 655 阅读 · 0 评论 -
关于自动化运维的那些事儿
随着近年全球运维大会的火热举办,自动化运维话题被推向了前所未有地热度。自动化运维并不是炒作的概念,而是随着信息技术发展的必要趋势。“大数据”“容器”“DevOps”“微服务”……,不断涌现出新的技术,而它们都有共同的特点,大大增加了运维管理的操作单元数量的同时对系统可用性有更高的可用性要求。从IBM、BMC、HP等传统厂商各类工具产品纷纷面市到Puppet、Ansible、Saltstack等开源解决方案风起云涌,自动化运维已经势不可挡。一、自动化运维的定义什么是自动化运维?很多人尝试给自动化.原创 2021-09-17 13:51:01 · 984 阅读 · 0 评论 -
什么是负载均衡?分布式负载均衡又是什么?
本文原出处:微信公众号-蓝鲸,已由本文作者于洋授权转载,未经同意请勿使用。一、 什么是负载均衡?一台服务器的处理能力,主要受限于服务器自身的可扩展硬件能力。所以,在需要处理大量用户请求的时候,通常都会引入负载均衡器,将多台普通服务器组成一个系统,来完成高并发的请求处理任务。提到的负载均衡,大家都想到了什么?DNS,LVS,nginx,HAProxy,反向代理,还是大名鼎鼎的F5?下面针对这些负载均衡技术做了分类和归纳。其实上面描述的解决方案,通常都是互联网web接入方案的负载均衡.原创 2021-09-08 16:30:53 · 1124 阅读 · 0 评论