5、数据流处理：模型与方法

最新推荐文章于 2025-11-05 09:16:54 发布

blue

最新推荐文章于 2025-11-05 09:16:54 发布

阅读量38

点赞数

CC 4.0 BY-SA版权

分类专栏：物联网数据流与电子健康创新文章标签：数据流处理流处理模型非阻塞操作

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/blue/article/details/149819348

物联网数据流与电子健康创新专栏收录该内容

39 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

数据流处理：模型与方法

1. 流处理的语义原语

流处理的主要通用原语函数可分为非阻塞和阻塞运算符两类。非阻塞运算符可直接应用于连续流，而阻塞运算符仅适用于有限序列。

1.1 非阻塞操作

非阻塞操作主要有过滤（Filter）和映射（Map）两种，它们都是无状态操作，处理流元素时无需维护状态信息，便于顺序或并行处理子流。大数据流分析平台如 Spark、Storm、Kafka、Samza 等都提供了这些操作的实现。
- 过滤（Filter） ：根据谓词（条件）对数据流中的元组进行筛选，决定是否包含或排除某些元组。例如，过滤体温在 36.5 - 37.5ºC 范围内的数值，只处理超出该范围的值。
- 设 $P_T$ 是流 $S_T$ 中类型为 $T$ 的元组的过滤谓词集合，过滤操作 $\sigma : S_T × P_T → S_T$ 返回满足给定过滤谓词的流元素。
- 过滤谓词 $p \in P_T$ 是一个函数 $p : \hat{T} → {true, false}$。
- 映射（Map） ：通过应用一个函数来转换输入流中的每个元组，可以将原始值映射到归一化区间内的值，映射结果可以是相同类型或不同类型的元组。
- 设 $F_{map}$ 是将类型为 $T_1$ 的元组映射到类型为 $T_2$ 的元组的所有映射函数集合，映射运算符 $\mu : S_{T_1} × F_{map} → S_{T_2}$ 对每个流元素的元组组件应用给定的映射函数 $f \in F_{map}$。
- 映射函数可以是高阶函数，这种定义比关系代数中的投影运算符更强大，因

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。