15、观测性实施案例分析:goFast与superEats

观测性实施案例分析:goFast与superEats

1. 观测性的好处

在深入案例之前,先了解一下观测性的好处:
| 好处 | 描述 |
| — | — |
| 关联应用以提供更高商业价值 | 使应用相互关联,提升整体商业价值 |
| 改善客户体验以提高客户忠诚度 | 让客户有更好的体验,增加忠诚度 |
| 工具合理化以提高投资回报率 | 合理使用工具,提升ROI |
| 不仅关注技术,还关注流程 | 全面考虑技术和流程 |
| 将数据噪音转化为可操作的见解 | 从大量数据中提取有用信息 |
| 自愈架构的基础 | 为系统的自我修复奠定基础 |

2. 案例一:goFast

goFast是一家出租车服务公司,拥有复杂的微服务架构,每个微服务运行在自己的容器中,并部署在AWS等云平台上。不同团队协作以提供最佳客户服务。

2.1 问题识别

goFast面临诸多挑战:
- 可扩展性:随着业务增长,处理更多乘客和司机的能力。
- 实时调度:确保准确高效地调度出租车,并实时更新可用性和位置信息。
- 支付处理:安全处理乘客支付,集成多个支付网关。
- 路线优化:优化出租车路线,减少时间和距离,提高司机效率和客户满意度。
- 基于位置的服务:为客户提供准确的司机和车辆位置及预计到达时间信息。
- 车辆跟踪:监控车辆实时位置、速度和状况,确保乘客安全。
- 数据管理:存储和管理大量客户和交易数据,同时确保数据隐私和安全。
- 移动优化:确保应用在移动设备上优化,界面友好,导航流畅。

2.2 解决问题

以下是goFast在观测性实施工作流程中的具体步骤:
1. 构思(Ideate)
- 评估是否需要观测性,各利益相关者达成共识,认为现有监控的IT资产覆盖和数据关联可改进,因事件平均响应时间(MTTR)不在可接受范围内。
- 组织可用资源,与高管讨论并获得支持,确定观测性实施用户并了解其期望。
2. 数据收集(Collect data)
- 因业务有不同的高峰负荷,使用容器和云平台管理负载。
- 选择Prometheus和Dynatrace工具收集数据,数据形式包括日志、性能指标和跟踪,从基础设施、应用和业务服务层收集。
- 必要时与应用工程团队合作,对应用进行检测以生成所需数据。
3. 数据分析(Analyze data)
- 构建多个仪表盘,跟踪相关指标和关键绩效指标(KPIs),关联多个微服务的数据,了解应用服务和业务功能。
- 利用人工智能学习高峰时段响应时间的模式,确保支付微服务在服务级别协议(SLA)内运行。
- 选择Splunk进行日志分析和可视化,了解微服务行为。
4. 问题发现(Catch issues)
- 通过广泛的数据收集、关联和分析,识别数据一致性问题、已知错误、性能瓶颈等。
- 快速缩小问题范围,降低MTTR,设置事件和警报,实现自动化和自愈。
- 监控服务的SLA,将违规情况告知负责团队。
5. 解决方案实施(Implement solutions)
- 应用工程团队根据分析结果实施解决方案,如增加微服务副本数量、添加负载均衡器等。
- 改进信息技术基础设施库(ITIL)流程,规范开发团队的日志记录实践。
6. 监控与演进(Monitor and evolve)
- 持续监控应用和微服务,确保解决方案有效,及时发现和解决新问题。
- 定期审查实施情况,完善仪表盘、警报、机器学习能力和自动化工作流程。
- 开发监控框架,包含特定类型应用组件的最佳实践。

mermaid格式流程图如下:

graph LR
    A[构思] --> B[数据收集]
    B --> C[数据分析]
    C --> D[问题发现]
    D --> E[解决方案实施]
    E --> F[监控与演进]
3. 案例二:superEats

superEats是一家食品制造公司,拥有端到端的供应链,从采购农产品到加工食品,再到销售给零售商和批发商。公司文化倾向于控制,对变革有一定抵制。

3.1 问题识别

superEats面临的挑战包括:
- 确保食品产品安全可食用,符合监管标准,预防食源性疾病。
- 管理原材料采购、成品生产和分销。
- 保持产品质量,确保口味、外观和安全性一致。
- 平衡生产成本与盈利能力和市场竞争力。
- 实施环保实践,减少制造过程中的浪费。
- 开发新产品以满足不断变化的消费者偏好,领先于竞争对手。
- 开发有吸引力且信息丰富的包装,符合法律要求,提升产品吸引力。

3.2 解决问题

superEats在观测性实施工作流程中的步骤如下:
1. 构思(Ideate)
- 确定需要监控的供应链阶段,如原材料采购、生产、包装和分销。
- 遵循构思阶段的典型活动,包括与领导、工程和支持团队合作。
2. 数据收集(Collect data)
- 从温度传感器、湿度传感器和RFID标签等多种来源收集数据。
- 数据形式包括固件的日志和指标,以及软件组件的日志、指标和跟踪。
- 使用OpenTelemetry收集基于时间序列的固件数据。
- 评估工具能否处理来自固件和软件的混合数据,必要时投资新工具。
3. 数据分析(Analyze data)
- 成功收集数据后,通过结合固件和软件数据,实现供应链的端到端视图。
- 配置观测性工具构建仪表盘,识别数据模式和趋势,了解供应链行为。
- 应用数据素养,特别是处理来自固件的数据,与固件供应商的技术团队合作。
- 构建围绕重要KPIs的仪表盘,如前置时间、订单履行率等。
- 制定数据访问、加密和安全政策。
4. 问题发现(Catch issues)
- 使用收集的数据识别问题,如温度偏差、集成问题、数据泄露或产品移动延迟。
- 使用观测性工具将问题告知相关支持团队。
5. 解决方案实施(Implement solutions)
- 根据分析结果实施解决方案,如调整存储设施的温度设置、实施新的物流系统。
- 推动文化变革,采用严格的变更管理实践。
6. 监控与演进(Monitor and evolve)
- 持续监控供应链,确保解决方案有效,解决未覆盖的问题。
- 更频繁地审查与食品质量相关的观测性工件。
- 节省成本,提高决策能力,管理员可相应调整分销或与客户沟通。

mermaid格式流程图如下:

graph LR
    G[构思] --> H[数据收集]
    H --> I[数据分析]
    I --> J[问题发现]
    J --> K[解决方案实施]
    K --> L[监控与演进]

通过这两个案例可以看出,观测性可以帮助企业深入了解复杂系统的行为和性能,及时识别和解决问题。在实施观测性时,企业需要根据自身情况,按照合适的工作流程逐步推进,以实现观测性的各项好处。同时,企业也需要思考如何进一步优化,以充分发挥观测性的潜力。

观测性实施案例分析:goFast与superEats

4. 案例对比分析
对比项目 goFast superEats
业务类型 出租车服务 食品制造与供应链
架构特点 微服务架构,运行在容器和云平台 端到端供应链,涉及固件和软件
面临挑战 可扩展性、实时调度、支付处理等 食品安全、质量控制、成本平衡等
数据收集 从基础设施、应用和业务服务层收集日志、指标和跟踪 从多种传感器和系统收集固件和软件数据
工具选择 Prometheus、Dynatrace、Splunk OpenTelemetry等
文化特点 团队协作积极推进观测性 倾向控制,对变革有一定抵制

从这个表格可以清晰地看到,不同业务类型的企业在实施观测性时面临不同的挑战,并且在数据收集、工具选择和文化适应等方面也存在差异。

5. 观测性实施关键要点总结
  • 构思阶段
    • 各利益相关者达成共识,明确观测性实施的必要性。
    • 组织资源,获得高管支持,确定实施用户和期望。
  • 数据收集阶段
    • 选择合适的工具,根据业务特点确定数据来源和形式。
    • 必要时与相关团队合作,确保数据的有效收集。
  • 数据分析阶段
    • 构建仪表盘,关联数据,了解业务行为。
    • 运用人工智能和数据素养,提取有价值的信息。
  • 问题发现阶段
    • 利用收集和分析的数据,及时发现问题。
    • 设置合理的警报和事件机制,降低响应时间。
  • 解决方案实施阶段
    • 根据分析结果实施具体解决方案。
    • 注重文化变革和变更管理。
  • 监控与演进阶段
    • 持续监控系统,确保解决方案有效。
    • 定期审查和优化观测性工件。

mermaid格式流程图总结观测性实施流程:

graph LR
    A[构思] --> B[数据收集]
    B --> C[数据分析]
    C --> D[问题发现]
    D --> E[解决方案实施]
    E --> F[监控与演进]
    F --> A

这个流程图展示了观测性实施是一个循环的过程,企业需要不断地进行监控和优化,以适应业务的变化和发展。

6. 对企业的启示
  • 明确自身需求 :企业在考虑实施观测性之前,需要清楚了解自身业务面临的挑战和需求,像goFast和superEats一样,根据实际情况确定观测性的实施重点。
  • 选择合适工具 :根据业务架构和数据特点选择合适的观测性工具,确保能够有效收集、分析和处理数据。
  • 注重团队协作 :观测性实施涉及多个团队,如开发、运维、业务等,需要各团队密切协作,共同推进项目。
  • 文化适应与变革 :企业需要根据自身文化特点,采取合适的方式推动观测性实施。对于抵制变革的企业,如superEats,需要逐步推动文化变革,确保项目顺利进行。
  • 持续优化 :观测性不是一次性的项目,而是一个持续的过程。企业需要不断地监控和优化系统,以实现观测性的最大价值。

总之,观测性对于企业了解复杂系统的行为和性能、及时解决问题具有重要意义。通过借鉴goFast和superEats的案例,企业可以更好地规划和实施观测性项目,提升自身的竞争力和运营效率。

【电能质量扰动】基于ML和DWT的电能质量扰动分类方法研究(Matlab实现)内容概要:本文研究了一种基于机器学习(ML)和离散小波变换(DWT)的电能质量扰动分类方法,并提供了Matlab实现方案。首先利用DWT对电能质量信号进行多尺度分解,提取信号的时频域特征,有效捕捉电压暂降、暂升、中断、谐波、闪变等常见扰动的关键信息;随后结合机器学习分类器(如SVM、BP神经网络等)对提取的特征进行训练分类,实现对不同类型扰动的自动识别准确区分。该方法充分发挥DWT在信号去噪特征提取方面的优势,结合ML强大的模式识别能力,提升了分类精度鲁棒,具有较强的实用价值。; 适合人群:电气工程、自动化、电力系统及其自动化等相关专业的研究生、科研人员及从事电能质量监测分析的工程技术人员;具备一定的信号处理基础和Matlab编程能力者更佳。; 使用场景及目标:①应用于智能电网中的电能质量在线监测系统,实现扰动类型的自动识别;②作为高校或科研机构在信号处理、模式识别、电力系统分析等课程的教学案例或科研实验平台;③目标是提高电能质量扰动分类的准确效率,为后续的电能治理设备保护提供决策依据。; 阅读建议:建议读者结合Matlab代码深入理解DWT的实现过程特征提取步骤,重点关注小波基选择、分解层数设定及特征向量构造对分类能的影响,并尝试对比不同机器学习模型的分类效果,以全面掌握该方法的核心技术要点。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值