AIoT与数字孪生:技术原理与应用实践
1 AIoT系统的数据处理
1.1 大循环(The Big Loop)
对于一些AIoT系统而言,捕捉代表系统需要处理的所有可能情况的数据颇具挑战。特别是当系统必须应对非常复杂且频繁变化的环境,同时追求高精度或自动化水平时,这一挑战更为显著,例如自动驾驶领域。
为应对系统需处理的众多不同且潜在困难的情况,一些公司正在实施“大循环”策略。这个循环能够持续捕捉系统尚未能处理的新的相关场景,将这些新场景输入机器学习算法进行再训练,并使用新模型更新现场资产。由于这种方法可以处理大量传感器数据,并通过过滤出相关场景使数据更易于管理,因此也被称为大循环。
1.2 数据科学(Data Science)
1.2.1 AIoT数据类别
数据科学家需要干净的数据来构建和训练预测模型。ML数据可以有多种形式,包括文本(如自动纠错)、音频(如自然语言处理)、图像(如光学检查)、视频(如安全监控)、时间序列数据(如电量计量)、事件序列数据(如机器事件),甚至时空数据(描述特定位置和时间段内的现象,如交通预测)。许多ML用例要求对原始数据进行标注,标注可以为ML算法提供额外的上下文信息,如图像分类。
1.2.2 数据集(Data Sets)
在ML项目中,需要数据集来训练和测试模型。数据集是数据的集合,例如一组文件或数据库中的特定表。对于数据库表,表中的行对应数据集的成员,而每一列代表一个特定变量。在准备数据时,可以参考以下问题:
- 数据是否完整?
- 数据是否与用例相关?
- 如果有标注,标注是否一致?
- 偏
超级会员免费看
订阅专栏 解锁全文
59

被折叠的 条评论
为什么被折叠?



