基于云的物联网中的机器学习与数据传输定价
1. 机器学习性能指标
在机器学习中,有多种性能指标用于评估模型的有效性。
-
对数损失(Log Loss)
:对数损失的值范围是 $[0, ∞)$。越接近 0 的对数损失表示模型的准确性越高,而远离 0 则意味着准确性较低。一般来说,最小化对数损失可以提高分类器的准确性。
-
曲线下面积(AUC)
:这是二元分类器的一个性能指标。通过比较接收者操作特征(ROC)曲线和 AUC,可以了解曲线在左上角的程度。AUC 值越高越好。
-
精确率(Precision)
:当仅靠机器学习模型的准确性不足以判断网络是否有效时,会使用精确率。其计算方法是预测为类别 j 且实际属于类别 i 的样本数量,公式为:$\frac{TP}{TP + FP}$,其中 TP 表示真正预测的样本数量,FP 表示错误预测的样本数量。
-
召回率(Recall)
:召回率也称为分类方法的灵敏度。在机器学习训练中,我们的目标是同时最大化召回率和精确率。召回率计算的是真实预测类别在所有预测样本中的百分比,公式为:$\frac{TP}{TP + FN}$,其中 TP 表示真正的正样本,FN 表示假负样本。
-
F1 分数
:F1 分数是召回率和精确率的组合。当需要在精确率和召回率之间寻求平衡时,就需要用到 F1 分数,它也被称为调和平均数,公式为:$\frac{2 \times Recall \times Precision}{Recall + Precision}$。
-
平均绝对误差(MAE)
:平均绝对误差衡量的是一组预测中误差的平均大小,不考虑误差的方向。它是测试样本预测值与实际观测值之间绝对差异的平均值,所有个体差异具有相同的权重,公式为:$MAE = \frac{1}{n} \sum_{j = 1}^{n} |\hat{y}
j - y_j|$。
-
均方根误差(RMSE)
:均方根误差是一种二次评分规则,用于衡量误差的平均大小。它是预测值与实际观测值之间平方差异平均值的平方根,公式为:$RMSE = \sqrt{\frac{1}{n} \sum
{j = 1}^{n} (\hat{y}_j - y_j)^2}$。
| 指标名称 | 含义 | 公式 |
|---|---|---|
| 对数损失 | 衡量模型准确性,越接近 0 越好 | - |
| 曲线下面积(AUC) | 二元分类器性能指标,值越高越好 | - |
| 精确率 | 评估预测为某类且实际属于该类的比例 | $\frac{TP}{TP + FP}$ |
| 召回率 | 衡量真实预测类别在所有预测样本中的占比 | $\frac{TP}{TP + FN}$ |
| F1 分数 | 平衡精确率和召回率 | $\frac{2 \times Recall \times Precision}{Recall + Precision}$ |
| 平均绝对误差(MAE) | 误差平均大小,不考虑方向 | $\frac{1}{n} \sum_{j = 1}^{n} |
| 均方根误差(RMSE) | 误差平均大小,考虑平方差异 | $\sqrt{\frac{1}{n} \sum_{j = 1}^{n} (\hat{y}_j - y_j)^2}$ |
2. 智慧城市项目的研究问题
智慧城市(SC)项目主要致力于提升城市系统和应用的智能化水平,其一些要求和特点如下:
- 一个强大且可扩展的框架,结合安全和开放的访问。
- 以用户为中心或面向公民的架构方法。
- 大量可存储、可查找、可共享、有标签、可移动和可穿戴的公共和私人数据,使公民能够在任何需要的时间和地点访问信息。
- 具有分析和集成能力的应用层。
- 智能的物理和网络基础设施,允许传输大量异构数据,并支持复杂和分布式的服务与应用。
大数据分析支持的机器学习 - 智慧城市(ML - SC)应用的开发面临一些挑战,需要解决这些挑战才能实现可靠和准确的基于云的系统。传统的物联网分析方法是将原始数据发送到云端进行处理。云解决方案的组件和架构需要进一步开发,以实现更分散的分析。目前有新趋势将分析更靠近云边缘和智慧城市基础设施设备,但训练好的机器学习模型在特征分布改变时需要重新训练,因此迁移学习是一个有帮助的研究领域。此外,与语义技术的集成对于基于云的智慧城市应用的开发也是必要的,同时智能虚拟对象结合深度强化学习(DRL)算法可用于智慧城市服务。
graph LR
A[智慧城市项目] --> B[要求和特点]
B --> B1[强大可扩展框架]
B --> B2[用户中心架构]
B --> B3[大量数据支持]
B --> B4[分析集成应用层]
B --> B5[智能基础设施]
A --> C[ML - SC 应用挑战]
C --> C1[特征分布改变需重训]
C --> C2[传统分析方法局限]
C --> C3[语义技术集成需求]
C --> C4[智能虚拟对象应用]
3. 物联网数据传输定价
物联网(IoT)是一种广泛应用的技术,涵盖从智能电网到车辆网络,从智能家居到智能工作场所等多个领域。然而,物联网框架的实现面临诸多挑战,尤其是在路由协议方面。
无线传感器网络(WSNs)和射频识别(RFID)技术在物联网范式中起着重要作用。WSNs 因其弹性、自主性和能源效率,成为物联网信息收集任务的重要候选者;RFID 技术则因其低成本和非视距无缝识别能力,成为物联网框架的关键参与者。
物联网路由由于多种因素而变得复杂。首先,物联网节点对数据包的完整路径只有部分了解,由于节点移动导致的连接中断,节点需要采用存储 - 携带 - 转发(Store - Carry - Forward)的方式来处理数据。其次,大多数参与物联网传感、识别和中继的实体属于不同的网络,由多个所有者拥有,因此在制定合适的路由协议时,需要考虑价格和交易因素。
为了解决这些问题,定义了物联网设置的四个主要特征:成本效益、无缝集成、可靠性和信任以及延迟容忍度。提出了一个框架,包括具有成本效益的物联网架构,以满足物联网设置的这些特征,并实现数据传输目标。该框架的贡献包括定制的路由方法和定价模型,定价模型考虑了负载平衡、延迟、缓冲区空间和链路维护等因素。
| 物联网相关技术 | 特点 |
|---|---|
| 无线传感器网络(WSNs) | 弹性、自主、能源高效,用于信息收集 |
| 射频识别(RFID)技术 | 低成本,非视距无缝识别 |
graph LR
A[物联网] --> B[面临挑战]
B --> B1[路由协议不完善]
B --> B2[节点路径信息不全]
B --> B3[多所有者网络协作问题]
A --> C[解决方案]
C --> C1[定义物联网特征]
C --> C2[提出框架]
C2 --> C21[定制路由方法]
C2 --> C22[定价模型]
4. 自适应路由方法(ARA)及相关模型
为了实现物联网数据的有效传输,提出了自适应路由方法(ARA),同时还涉及到物联网系统的多个模型。
-
物联网模型
:它是一个动态且相互作用的网络,涵盖了各种可识别的事物。该模型为整个物联网系统提供了基础架构,使得不同的设备和节点能够相互连接和通信。
-
物联网节点
:
-
剩余能量和功率模型
:节点的剩余能量和功率状况对于其持续工作至关重要。合理的能量管理可以延长节点的使用寿命,确保物联网系统的稳定运行。
-
负载和缓冲区空间
:节点需要处理一定的负载,并且有相应的缓冲区空间来存储数据。负载过高或缓冲区空间不足可能会导致数据传输延迟或丢失。
-
延迟
:延迟是影响物联网数据传输实时性的重要因素。在设计路由时,需要尽量减少延迟,以满足一些对时间敏感的应用需求。
-
信任
:节点之间的信任关系对于数据的安全传输至关重要。只有建立了可靠的信任机制,才能保证数据在传输过程中不被篡改或泄露。
-
定价模型
:考虑到物联网中节点属于不同所有者,定价模型用于补偿节点在数据中继过程中的资源消耗。它综合了负载平衡、延迟、缓冲区空间和链路维护等因素,确保节点愿意参与数据中继。
-
通信模型
:该模型规定了节点之间的通信方式和规则,保证数据能够在物联网中准确、高效地传输。
graph LR
A[物联网系统] --> B[物联网模型]
A --> C[物联网节点]
C --> C1[剩余能量和功率模型]
C --> C2[负载和缓冲区空间]
C --> C3[延迟]
C --> C4[信任]
A --> D[定价模型]
A --> E[通信模型]
5. 用例与理论分析
通过具体的用例和理论分析来验证所提出的模型和路由方法。使用马尔可夫链在 Q - 理论中进行分析,以评估模型在不同场景下的性能。例如,在一个包含多个物联网节点的场景中,模拟数据的传输过程,观察节点的行为和数据的流动情况。分析结果可以帮助确定模型的有效性和适应性,找出可能存在的问题,并进行相应的优化。
6. 性能评估
为了全面评估所提出的框架和路由方法的性能,进行了一系列的性能评估。
-
模拟设置和基线方法
:
- 确定模拟的环境参数,如节点数量、网络拓扑结构、数据流量等。
- 选择合适的基线方法进行对比,以突出所提出方法的优势。
-
性能参数和指标
:
-
数据包传输成功率
:衡量有多少数据包能够成功到达目的地,反映了路由方法的可靠性。
-
平均延迟
:计算数据包从源节点到目的节点的平均传输时间,体现了系统的实时性。
-
能量消耗
:评估节点在数据传输过程中的能量消耗情况,对于延长节点的使用寿命和降低系统成本至关重要。
-
模拟结果
:通过模拟实验得到了一系列的结果。与基线方法相比,所提出的方法在数据包传输成功率、平均延迟和能量消耗等方面都表现出了明显的优势。例如,数据包传输成功率更高,说明路由方法能够更有效地选择合适的路径;平均延迟更低,满足了一些对时间敏感的应用需求;能量消耗更低,延长了节点的使用寿命。
| 性能评估方面 | 具体内容 |
|---|---|
| 模拟设置和基线方法 | 确定环境参数,选择对比方法 |
| 性能参数和指标 | 数据包传输成功率、平均延迟、能量消耗 |
| 模拟结果 | 所提方法在各方面表现更优 |
7. 总结
物联网在当今社会的各个领域都有着广泛的应用前景,但同时也面临着诸多挑战,尤其是在数据传输和路由方面。通过定义物联网设置的四个主要特征,提出了一个包含定制路由方法和定价模型的框架,以解决物联网路由中的复杂问题。该框架经过用例验证和性能评估,表现出了良好的性能和适应性。在未来,随着物联网技术的不断发展,还需要进一步优化和完善该框架,以满足更多复杂场景的需求。同时,也需要加强对物联网安全和隐私的研究,确保物联网系统的可靠运行。
超级会员免费看
62

被折叠的 条评论
为什么被折叠?



