17、嵌入式系统可靠性构建与软件故障预测模型

最新推荐文章于 2025-10-03 12:16:47 发布

devops8pract

最新推荐文章于 2025-10-03 12:16:47 发布

阅读量56

点赞数

CC 4.0 BY-SA版权

分类专栏： Ada编程与软件可靠性进展文章标签：嵌入式系统可靠性构建故障树分析

本文链接：https://blog.youkuaiyun.com/devops8pract/article/details/150508509

Ada编程与软件可靠性进展专栏收录该内容

24 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

嵌入式系统可靠性构建与软件故障预测模型

1. 嵌入式系统可靠性构建方法

1.1 集成与分解流程

在嵌入式系统的构建过程中，反馈机制会引导开发者回到分解和设计阶段。集成基于三个同心电路：首先分析属于第 m 个组件的所有事件，接着关注属于第 n 级的所有组件，之后系统才能进入更高一级。当达到最高分解级别时，该过程终止。

1.2 工具实现

为了实现上述方法，开发了一款工具。该工具提供了接口和管理功能，允许用户根据自身需求对系统进行详细分解。在集成和验证过程中，通过与基于 Astra 的故障树分析（FTA）的接口完成必要的故障树分析。Astra 是高级软件可靠性分析工具集的缩写，目前计划将此方法作为独立工具纳入 Astra 技术体系。

1.3 案例研究

1.3.1 计算机辅助制动系统（CAB）

CAB 系统有定量和定性的安全要求。定性要求系统架构具有容错性，定量要求完全失去制动（即顶事件）的概率每小时小于 3 x 10 - 7。设计分解部分展示了 CAB 仅提供制动功能，且与驾驶员需求成比例。通过分析，可将“完全缺乏制动”的功能故障模式追溯到基本事件，甚至分解到操作系统级别，但在某些特殊情况下无法进一步分解，也无法提供可靠性数据。

1.3.2 燃油控制器

燃油控制器用于管理通过五个阀门的恒定流量，由电子控制器（EC）控制。软件通过状态转换图描述，提出了容错架构。系统在“cva_fails”或“bva_fails_closed”事件发生时进入 BVB_CVB 状态，事件逻辑如下：
- cva_fails = (ESS_L ∧ CV0_L ∨ ESS_H ∧ ¬ CV0_H) ∧ 0.5sec_timeout
- bva_fails_closed = ¬BVA0 ∧ 0.5sec_timeout

状态转换图如下：

stateDiagram-v2
    [*] --> IDLE
    IDLE --> BVA_CVB : cva_fails or bva_fails_closed
    IDLE --> BVB_CVB : cva_fails or bva_fails_closed
    IDLE --> BVA_CVA : ...
    BVA_CVB --> [*] : stop
    BVB_CVB --> [*] : stop
    BVA_CVA --> [*] : stop

1.4 状态分析与原因查找

在状态转换图中，查找原因可从两个方面进行：
- 阀门 BVA 关闭可能是因为进行了不应该进行的转换（“commission”）。
- 阀门 BVA 保持关闭可能是因为应该进行的转换未进行（“omission”）。

该方法会为每个状态引入逻辑变量，如“C_inStateBVA_CVA”，并将其附加到适当的原因上。

2. 软件可靠性分析模型

2.1 非齐次泊松模型

一些知名的软件可靠性增长模型基于非齐次泊松过程（NHPP），其中泊松参数是时间的函数。例如：
- Goel - Okumoto 模型：µ(t) = a(1 - e - bt)，a ≥ 0，b > 0
- Musa - Okumoto 模型：µ(t) = (1 / θ) log(λθt + 1)

这两个模型的主要区别在于 t → ∞ 时 µ(t) 的行为，前者属于有限类别模型，后者属于无限类别模型。Musa 基本执行时间模型与 Goel - Okumoto 模型具有相同的均值函数，但基于实际执行时间和不同的假设。

NHPP 模型专门为时间间隔故障数据设计，但也可应用于每个时间段的故障数据。

2.2 复合泊松模型

复合泊松过程（CPP）被提出作为软件可靠性模型。与 NHPP 模型不同，CPP 的均值函数与经过的时间成正比，因此具有简单的分析计算和估计程序。CPP 用于模拟分组故障的产生，分组故障在给定时间间隔内的到达遵循泊松分布，每组中的故障数量遵循给定的分布。

一个 CPP 由 M 个独立同分布的随机变量 Xi 的和给出，其中 M 遵循泊松分布。其分布函数 FY(x) 为：
[FY(x) = \sum_{m = 0}^{\infty} \frac{e^{-\lambda t} (\lambda t)^m}{m!} [GX(x)]^{m*}]

随机变量 N(t) 遵循 CPP 的概率为：
[pN(N(t) = n) = \sum_{m = 0}^{\infty} \frac{e^{-\lambda t} (\lambda t)^m}{m!} Pr{\sum_{i = 1}^{M} Xi = n | M = m}]

其概率生成函数 fN(z, t) 为：
[fN(z, t) = e^{-\lambda t} e^{\lambda t g(x)}]

其中 g(x) 是复合随机变量的概率生成函数。如果复合概率在零处截断（即 pX(x = 0) = 0），则上述求和扩展到 m。在 [10] 中提出的复合分布是几何分布（GD）：
[PX(x) = r (1 - r)^{x - 1}, x = 1, 2, 3, \cdots]

通常使用预测有效性来比较软件可靠性模型。假设在时间 ttot 内产生了 ntot 个故障，使用直到时间 tpast ≤ ttot 的故障数据来估计均值函数的参数，使得 µ(tpast) = npast，然后用估计的参数值替换 µ(t) 中的参数，得到直到 ttot 的故障数估计值 ˆµ(ttot)。

在软件故障数据存在离散性的情况下，提出使用样本的众数来估计零截断泊松分布的参数，因为该估计器对离散性不太敏感。考虑的样本数据包括凹形、S 形和两阶段曲线，通过不同数据集的结果有助于选择合适的模型和估计方法。

3. 嵌入式系统可靠性构建方法的优势与应用

3.1 方法优势

该嵌入式系统可靠性构建方法结合了多种经典的安全和可靠性分析技术，以确保结果的一致性，并有助于更好地理解和验证系统的可靠性与安全特性。它紧密结合经典的 V 生命周期，验证部分主要通过对（子）系统拓扑结构连续应用故障树分析来完成。若局部结果不满足可靠性或安全的最低条件，则需重新设计组件或其所属层，并再次进行相关验证。

此方法还具有以下优势：
- 多技术适用性 ：遵循特定形式，可在不同的分解阶段应用不同的安全分析技术。
- 软件故障分析 ：故障树分析的非定量结果可应用于软件故障，实现嵌入式系统的综合分析。软件组件以状态转换图的形式管理，便于自动化故障树分析逻辑部分的输入。
- 自动化优势 ：应用于复杂的实际系统时，会生成大量难以手动管理的表格，而开发的工具能自动化处理这些任务，通过强大的管理程序处理生成的效果和表格，并控制潜在事件的创建。该工具与拓扑层次结构的紧密联系，使其能够自动识别事件的超集，并提出和控制这些事件。

3.2 应用流程

以下是该方法在嵌入式系统中的应用流程：
1. 系统分解 ：使用工具根据需求对系统进行详细分解。
2. 集成与验证 ：在集成和验证过程中，通过与基于 Astra 的故障树分析接口进行必要的故障树分析。
3. 结果评估 ：对故障树分析的结果进行评估，若局部结果不满足可靠性或安全的最低条件，则返回步骤 1 重新设计组件或其所属层，并再次进行相关验证。
4. 持续优化 ：不断重复上述步骤，直到系统满足可靠性和安全要求。

3.3 应用案例总结

4. 软件可靠性分析模型的比较与选择

4.1 模型比较

4.2 模型选择

在选择软件可靠性分析模型时，需要考虑以下因素：
- 数据类型 ：如果数据是时间间隔故障数据，NHPP 模型可能更合适；如果是分组故障数据，CPP 模型可能更适用。
- 分析难度 ：若希望进行简单的分析计算和估计程序，CPP 模型是较好的选择；若需要更复杂的时间相关分析，NHPP 模型可能更符合需求。
- 数据离散性 ：当软件故障数据存在离散性时，使用样本众数估计零截断泊松分布参数的 CPP 模型可能更具优势。

4.3 选择流程

以下是选择软件可靠性分析模型的流程：

graph LR
    A[确定数据类型] --> B{是否为分组故障数据}
    B -- 是 --> C[考虑 CPP 模型]
    B -- 否 --> D[考虑 NHPP 模型]
    C --> E{数据是否存在离散性}
    E -- 是 --> F[使用样本众数估计参数的 CPP 模型]
    E -- 否 --> G[普通 CPP 模型]
    D --> H{是否需要复杂时间相关分析}
    H -- 是 --> I[选择合适的 NHPP 模型]
    H -- 否 --> J[根据其他需求选择模型]

5. 总结

本文介绍了嵌入式系统可靠性构建方法和软件可靠性分析模型。嵌入式系统可靠性构建方法通过结合多种经典分析技术，利用工具进行系统分解和验证，在实际案例中展示了其有效性和优势。软件可靠性分析模型包括非齐次泊松模型和复合泊松模型，各有特点和适用场景。在实际应用中，应根据数据类型、分析难度和数据离散性等因素选择合适的模型。通过对这些方法和模型的研究和应用，可以提高嵌入式系统的可靠性和软件的可靠性，为相关领域的发展提供有力支持。