物联网应用中的机器学习范式:机遇与挑战
1. 机器学习学习方式
在机器学习中,有两种不同的监督学习系统:批量学习和在线学习。
1.1 在线学习
当在整个数据集上进行计算学习可行,或者数据是在很长时间内产生,且学习系统必须对数据中的新趋势做出响应时,会使用在线学习。在线学习算法接收一系列示例,并独立处理每个示例。在每一轮在线学习中,算法接收一个实例,使用存储在内存中的内部预测来预测其标记,然后接收该实例的正确标签,并使用当前的实例 - 标签对更新和改进其内部理论。由于该算法只需正确预测/感知作为输入提供的示例的标签,因此不存在统计泛化的定义。
1.2 批量学习
批量学习(也称为数学学习)与在线学习不同。在批量学习中,假设在乘积空间 (X \times Y) 上存在一个概率分布,并且我们可以访问从该分布独立同分布抽取的训练集。批量学习算法使用训练集生成一个输出假设,这是一个将 (X) 中的实例映射到 (Y) 中的标签的函数。我们期望批量学习算法的性能假设能够正确预测从该分布中采样的先前未见过的示例的标签。
2. 大数据概述
大数据是科技界的热门话题,预计它将对技术、企业、行业、政府和文化产生巨大影响。从技术角度来看,大数据的处理、开发、保存和传输都是整个操作的一部分。数据采集、存储和传输阶段是基于数据分析的操作这一最终目标的重要前奏,而数据分析是大数据分析的核心。
从数据挖掘的角度来看,“大数据”可以用四个“V”来描述:
| V’s | 含义 | 说明 |
| — | — | — |
| Volume(体量) | 结果的大小 | 可能太大,当前
超级会员免费看
订阅专栏 解锁全文
69

被折叠的 条评论
为什么被折叠?



