SLA的基本概念

SLA的基本概念

     现在的产品和系统都非常的复杂,彼此连接依赖越来越复杂,为了整体的高速运转,对每个部件的稳定性越来越高,越来越精密,发展到一定程度,人力已经无法掌控,任何一个组件出异常都有可能牵一发而动全身,影响全局。每个部件的稳定性和精密程度决定了整体的工程质量,也决定了整体的发展速度。
 
     一. 定义SLI(Service Level Indicator 关键量化指标)  
     SLI关注下面五点:
  1.  要测量的指标是什么?

  2. 测量时的系统状态?

  3. 如何汇总处理测量的指标?

  4. 测量指标能否准确描述服务质量?

  5. 测量指标的可靠度(trustworthy)?

     二. SLO
          Service-Level Objective 服务等级目标)指定了服务所提供功能的一种期望状态。
          SLO是用SLI来描述的,一般描述为:5XX的失败率小于0.005%等。访问正常率>99.99%等。

      三. SLA
      SLA,即服务等级协议。
          一个有明确SLA的服务最理想的运行状态是:  增加额外资源来改进系统所带来的收益小于把该资源投给其他服务所带来的收益。           一个简单的例子就是某服务可用性从99.9%提高到99.99%所需要的资源和带来的收益之比,是决定该服务是否应该提供4个9的重要依据。

     四. 举一个亚马逊的S3服务水平协议
      可用性保证(Service Commitment )
          保证“每月99.9%的正常运行时间”。S3 SLA保证一个月里所有以5分钟为单位的时间片中,平均有99.9%是可用的。SLA容许的最遭情况等于每月有40分钟不可用。
      服务补偿(Service Commitment )
          如果达不到SLA的承诺,Amazon会提供服务补偿,如果达不到 99.9%的服务水平,那么Amazon将减免下个月10%的费用。如果可用性下降到99.0%以下,换算后相当于一个月内至少有将近7个小时无法服务, 那么Amazon将减免25%的费用。
          假设一个用户存放了500G的数据。把500G数据放进S3并且在一个月内全部数据都使用10次的话,总共的费用大约是$1000。如果发生5小时的故障,那么该用户将得到$100的退款。如果故障时间从7个小时到一整个月的话, 该用户将得到$250的补偿。 


      
### Oracle服务级别协议(SLA)配置与定义 Oracle服务级别协议(Service Level Agreement, SLA)是一种用于定义和监控数据库性能及可用性的机制。它通过结合Oracle Enterprise Manager (OEM)、Oracle Database Resource Manager以及Oracle Real Application Clusters (RAC)等功能,确保数据库服务满足业务需求。 #### 1. Oracle SLA基本概念 SLA在Oracle环境中通常包括以下内容: - **响应时间**:定义用户请求的平均响应时间。 - **吞吐量**:定义系统在单位时间内可以处理的事务数量。 - **可用性**:定义系统正常运行的时间比例,通常以百分比表示。 - **资源分配**:通过Oracle Database Resource Manager设置优先级和资源限制[^2]。 #### 2. Oracle SLA的配置方法 Oracle SLA可以通过以下方式实现配置和监控: - **Oracle Enterprise Manager (OEM)**:OEM提供了一个图形化界面,用于定义和监控SLA目标。例如,可以设置响应时间阈值,并在超出阈值时触发警报[^3]。 ```sql -- 示例:使用DBMS_SERVICE包创建服务并设置SLA参数 BEGIN DBMS_SERVICE.CREATE_SERVICE ( service_name => 'my_service', network_name => 'my_service'); DBMS_SERVICE.MODIFY_SERVICE ( service_name => 'my_service', goal => DBMS_SERVICE.GOAL_THROUGHPUT, importance => 5); END; / ``` - **Oracle Database Resource Manager**:通过创建资源计划(Resource Plan),可以为不同的用户组或服务分配CPU和其他资源。这有助于确保高优先级任务获得足够的资源支持[^4]。 ```sql -- 示例:创建资源计划并分配资源 BEGIN DBMS_RESOURCE_MANAGER.CREATE_PLAN( plan => 'MY_PLAN', comment => 'Resource plan for SLA'); DBMS_RESOURCE_MANAGER.CREATE_PLAN_DIRECTIVE( plan => 'MY_PLAN', group_or_subplan => 'GROUP1', cpu_p1 => 60, cpu_p2 => 40); END; / ``` - **Oracle RAC中的CSS超时参数**:在RAC环境中,Cluster Synchronization Services (CSS)的`misscount`和`disktimeout`参数对SLA有重要影响。这些参数决定了节点故障检测和恢复的时间窗口[^1]。 #### 3. Oracle SLA的定义与监控 为了有效定义和监控SLA,需要完成以下任务: - 定义明确的性能指标和目标。 - 使用OEM或其他监控工具定期收集性能数据。 - 根据历史数据调整资源分配策略,优化SLA合规性。 #### 4. 常见问题与解决方法 - **性能下降**:检查资源分配是否合理,并调整Resource Manager设置。 - **节点故障**:优化CSS超时参数,确保快速检测和恢复。 - **监控不足**:启用高级监控功能,如AWR报告和ASH分析。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值