73、模糊数据仓库与移动网络干扰最小化技术研究-优快云博客

本文链接：https://blog.youkuaiyun.com/b9c0d/article/details/150439322

模糊数据仓库与移动网络干扰最小化技术研究

模糊数据仓库中的数据处理

模糊测度的运算

在模糊数据仓库中，存在一些特定的运算规则。对于清晰测度和模糊测度，有如下运算关系：
- (m_{A/B} = m_A/m_B)
- (m_{A/B} + β_{A/B} = (m_A +β_A)/m_B)
- (m_{A/B} - α_{A/B} = (m_A - α_A)/m_B)

这些运算不仅适用于清晰测度，还能应用于 L - R 模糊区间。例如，对于两个由四个参数表示的 L - R 模糊区间 (A_1 = (m_{A1}, n_{A1}, α_{A1}, β_{A1})) 和 (A_2 = (m_{A2}, n_{A2}, α_{A2}, β_{A2}))，它们的和为：
(A_1 + A_2 = (m_{A1}, n_{A1}, α_{A1}, β_{A1}) + (m_{A2}, n_{A2}, α_{A2}, β_{A2}) = (m_{A1} + m_{A2}, n_{A1} + n_{A2}, α_{A1} + α_{A2}, β_{A1} + β_{A2}))

逻辑运算符

为了对模糊数据进行比较和排序，以及实现最大（FMAX）和最小（FMIN）聚合函数，需要定义模糊数的多数和少数运算符。
- 多数关系 ：基于比较模糊数隶属函数的相应参数来定义。首先比较模态值，若相等则比较右扩展，若右扩展也相等则比较左扩展。
- 少数关系 ：计算方式与多数关系类似，但当模态值相等时，先比较左扩展，若左扩展相等再比较右扩展。

语言量词

语言量词是由 Zadeh 引入的特殊术语，取自自然语言，如“几乎所有”“大多数”“至少一半”“几个”“至少 20%”等。这些术语包含比例信息，可表示为单位区间 [0,1] 的模糊子集。语言量词可表达聚合数据组的基数，也可用于指定数据组的过滤条件。在 SQL SELECT 语句的语法中，模糊语言量词占据聚合函数的位置，因此有时也被称为语言聚合函数。

模糊数据仓库示例

以资源模糊数据仓库为例，该仓库存储全球自然资源的消费和需求信息。其简化架构包含以下多维模型元素：
| 类型 | 具体内容 |
| ---- | ---- |
| 维度 | 地理（属性层次：大陆→国家）、时间（属性层次：年→季度→月）、资源（属性层次：类别→资源） |
| 事实 - 需求 | 消费数量（资源消费，清晰数据）、消费成本（资源消费成本，清晰数据）、需求数量（资源需求，L - R 模糊数）、需求成本（资源需求成本，L - R 模糊数） |

仓库中的模糊数据有两种呈现形式：
- 四元组 ((l, m, n, p))，其中 ((m, n)) 是模态值区间，(l = m - α)，(p = n + β)，(α > 0) 和 (β > 0) 分别是左扩展和右扩展，该四元组确定模糊数的梯形隶属函数，当 (m = n) 时为三角形隶属函数。
- 语言值“approx. x”，其中 (x) 是 (m) 和 (n) 值的平均值。

以下是需求数量模糊测度的示例值：
| RequirementAmount（四元组形式） | RequirementAmount（语言值形式） |
| ---- | ---- |
| (2416;2517;2617;2717) | approx.2567 |
| (976;1017;1017;1057) | approx.1017 |
| (1571;1637;1697;1762) | approx.1667 |

该资源数据仓库采用 ROLAP 技术，数据和聚合由关系数据库引擎维护，数据来源于公告板、新闻和电子论文。

模糊数据仓库中的数据聚合和过滤组

数据仓库系统通常用于查询和聚合数据。当数据仓库包含模糊测度时，需要扩展常用的 SQL SELECT 语句的标准语法，这不仅涉及实现模糊聚合函数（如 FSUM、FAVG、FMIN、FMAX），还涉及扩展 HAVING 子句以在数据分析期间过滤记录组。以下是几种不同的数据聚合情况：
1. 模糊数据的聚合
- 示例：生成 2010 年人均 GDP 超过 30000 美元且煤炭资源需求费用最高的 10 个国家的排名。
- 查询语句 ：

SELECT TOP 10 g.Country, FSUM(RequirementCost) AS TotalCost
FROM  DimGeography g JOIN FactRequirements rf ON g.GeoId = rf.GeoId
JOIN DimTime t ON rf.TimeId = t.TimeId  
JOIN DimResource r ON rf.ResId = r.ResId
WHERE r.Resource = 'coal' AND g.GDP > 30000 AND t.Year = 2010
GROUP BY g.Country ORDER BY TotalCost DESC;

- **结果示例**：

Country	TotalReqCost
USA	approx. 1863
Japan	approx. 1632
France	approx. 1629
Australia	approx. 1534

具有模糊条件的清晰数据聚合
- 示例：显示特定年份和面积超过 120000 (km^2) 的国家的石油资源月平均消费量，仅显示消费量高且兼容度大于 0.7 的国家。
- 查询语句 ：

SELECT g.Country, t.Year, r.Resource,  
AVG(ConsumptionAmount) AS AverageMonthConsumption
FROM  DimGeography g JOIN FactRequirements rf ON g.GeoID = rf.GeoID
JOIN DimTime t ON rf.TimeID = t.TimeID  
JOIN DimResource r ON rf.ResID = r.ResID
WHERE g.Area > 120000 AND r.Resource = 'oil'
GROUP BY r.Resource, g.Country, t.Year
HAVING ( AVG(ConsumptionAmount) ~= high() ) > 0.7;

- **结果示例**：

Country	Year	Resource	AverageMonthConsumption
China	2009	oil	5773
Russia	2007	oil	5142
USA	1998	oil	4184

具有清晰条件的模糊数据聚合
- 示例：生成 2010 年特定国家和大陆的特定资源类别的需求平均成本报告，仅显示需求成本约为 1.5 亿美元且兼容度大于等于 0.5 的国家。
- 查询语句 ：

SELECT g.Continent, g.Country, r.Category,  
FAVG(RequirementCost) AS AverageReqCost
FROM  DimGeography g JOIN FactRequirements rf ON g.GeoID = rf.GeoID
JOIN DimTime t ON rf.TimeID = t.TimeID  
JOIN DimResource r ON rf.ResID = r.ResID
WHERE t.Year = 2010 GROUP BY g.Continent, g.Country, r.Category
HAVING ( FAVG(RequirementCost) ~= 150 ) >= 0.5;

- **结果示例**：

Continent	Country	Category	AverageReqCost
Asia	China	non - renewable	approx. 146
Asia	Saudi Arabia	non - renewable	approx. 148
Europe	France	non - renewable	approx. 150
Europe	Italy	renewable	approx. 146
North America	USA	non - renewable	approx. 153

具有模糊条件的模糊数据聚合
- 示例：显示特定大陆的资源总需求，仅显示总需求低且兼容度大于 0.8 的大陆。
- 查询语句 ：

SELECT g.Continent, r.Resource, r.Unit,  
FSUM(RequirementAmount) AS TotalRequirement
FROM  DimGeography g JOIN FactRequirements rf ON g.GeoID = rf.GeoID
JOIN DimTime t ON rf.TimeID = t.TimeID  
JOIN DimResource r ON rf.ResID = r.ResID
GROUP BY g.Continent, r.Resource, r.Unit
HAVING ( FSUM(RequirementAmount) ~= low() ) > 0.8;

- **结果示例**：

Continent	Resource	Unit	TotalRequirement
Australia & Oceania	gas	ton	approx. 315491
Australia & Oceania	tea	kg	approx. 316487
Australia & Oceania	water	(m^3)	approx. 301659
South America	coffee	kg	approx. 318204
South America	grain	ton	approx. 307051
South America	oil	ton	approx. 316282

模糊量词的使用
- 示例：显示 2009 年第三季度几乎所有煤炭需求都发生的国家，仅显示兼容度大于 0.7 的国家。
- 查询语句 ：

SELECT g.Country, FSUM(RequirementAmount) AS TotalRequirement
FROM  DimGeography g JOIN FactRequirements rf ON g.GeoID = rf.GeoID
JOIN DimTime t ON rf.TimeID = t.TimeID  
JOIN DimResource r ON rf.ResID = r.ResID
WHERE t.Year = 2009 AND r.Resource = 'coal' GROUP BY g.Country
HAVING almost_all( t.Quarter = ‘Q3’ ) > 0.7;

- **结果示例**：

Country	TotalRequirement
China	approx. 30661
France	approx. 25783
Germany	approx. 26836
Japan	approx. 23773

模糊数据比较流程

graph TD;
    A[开始] --> B{两个模糊数是否只有一个共同点};
    B -- 是 --> C[该点确定兼容度];
    B -- 否 --> D{有多个共同点};
    D -- 是 --> E[获得多个兼容度];
    E --> F[选择最高的兼容度];
    C --> G[结束];
    F --> G;

以上内容展示了模糊数据仓库中数据处理、聚合和过滤的相关技术和方法，通过这些方法可以更有效地处理和分析包含模糊信息的数据。

移动网络中的干扰最小化

移动网络概述

即将到来的无线多跳网络，如自组织网络和传感器网络，允许节点使用无线收发器直接相互通信，无需固定基础设施，也无需基站。自组织网络通过无线技术和各种便携式设备（如笔记本电脑、手机等）以及固定设备（如无线互联网接入点等）连接而成。无线传感器网络是一种特殊的自组织网络，其节点是具有先进传感功能（如热、压力、声学等）、处理器和短程无线收发器的“传感器”，可收集环境数据并发送到数据接收器。移动自组织和传感器网络还配备了移动设备，如 PDA、笔记本电脑或数据收集节点，这些设备可与固定节点通信。如果网络是两层或多层的，还存在簇头节点，形成节点层次结构，实现簇间通信。

信道分配问题（CAP）

构建无线网络与无线电信道分配问题（CAP）相关。根据 CAP 的分类，可分为 CAP1 和 CAP2 两类：
- CAP1 ：在满足需求和无干扰约束的条件下，最小化信道跨度。
- CAP2 ：在满足需求约束的条件下，最小化干扰。在实际应用中，CAP2 更为常用，因为移动通信需求高且常使用拓扑控制协议。

在自组织和传感器网络中，干扰是不良现象。若节点 a 的干扰范围覆盖节点 b，则节点 a 可能干扰节点 b，节点 b 所受的干扰量是像 a 这样的节点数量。减少干扰有助于降低编码开销，节省电池驱动设备的能量，从而延长网络寿命。

干扰最小化方法

此前已有多种方法用于减少自组织和传感器网络中的干扰：
- 传统算法 ：如 G. Calinescu 研究了在满足连接要求的无线自组织网络中减少节点总能耗的问题，延长了自组织网络的寿命；T. Moscibroda 和 R. Wattenhofer 给出了一个用于近似满足连接要求的干扰的贪心算法；von Rickenbach 研究了最小化最大干扰的问题，并给出了一个 (O(4\sqrt{n})) 的近似算法来评估干扰。
- 人工智能方法 ：如 Kunz 通过最小化表示干扰和信道分配约束的能量或成本函数来解决信道分配问题；K. Smith 和 M. Palaniswami 使用模拟退火、改进的 Hopfield 神经网络和自组织神经网络来解决同一问题；L. Wang 等人研究了随机混沌模拟退火（SCSA）来解决旅行商问题和蜂窝移动通信的信道分配问题（CA）。

随机混沌模拟退火（SCSA）方法

本文提出使用随机模拟退火来最小化移动分层自组织和传感器网络中的干扰。具体步骤如下：
1. 问题表述 ：针对这些网络的信道分配问题（CAP），根据总干扰确定该问题能量函数的需求约束。
2. 求解方法 ：借助神经网络解决 CAP 问题。
3. 模拟结果 ：表明通过选择一组参数，可以在这些网络中实现干扰最小化。扩展该技术还可用于动态 CAP 以解决更复杂的优化问题。

模拟结果

通过模拟研究验证了所提出方法的有效性。通过选择合适的参数集，能够在移动自组织和传感器网络中实现干扰最小化。这表明该方法在实际应用中具有一定的可行性和优势。

干扰最小化流程

graph TD;
    A[开始] --> B[定义 CAP 问题的需求约束];
    B --> C[使用神经网络解决 CAP 问题];
    C --> D[选择参数集];
    D --> E{是否实现干扰最小化};
    E -- 是 --> F[结束];
    E -- 否 --> D;

总结

探索全球自然资源的消费和需求需要软计算方法来扩展分析范围。在数据仓库中实现 L - R 模糊类型可以存储和分析不精确数据，对具有相似特征的数据进行研究。特别是在大型数据仓库中，这有助于进行粗略和快速的数据分析与过滤，提高调查的可能性。在数据聚合时，如果包含模糊测度，需要使用模糊数算术或模糊逻辑的元素，这可能会增加响应时间，但研究表明，与使用标准 SQL 语言实现的相应查询相比，响应时间仅增加约 10%。

在移动网络方面，随机混沌模拟退火结合神经网络的方法为解决移动分层自组织和传感器网络中的干扰最小化问题提供了一种有效的途径。通过合理选择参数，可以在实际网络中实现干扰的有效控制，延长网络寿命，提高网络性能。未来，这些技术有望在更多领域得到应用和发展，为无线通信的发展提供有力支持。

对比表格

方法类型	适用场景	优点	缺点
传统算法	满足连接要求的无线自组织网络	可解决特定的干扰问题，如减少总能耗	可能不适用于所有网络场景，算法复杂度可能较高
人工智能方法	多种无线通信场景	可通过优化算法实现干扰最小化	需要合适的参数选择，可能需要较多的计算资源
随机混沌模拟退火（本文方法）	移动分层自组织和传感器网络	可有效实现干扰最小化，有一定扩展性	响应时间可能会有所增加