数据流式传输:概念、挑战与应用
1. 数据流式传输简介
数据流式传输是一种系统,其中数据从多个源持续流动,就像水在溪流中流动一样。数据通常以许多小文件或记录的连续流形式同时产生和收集。数据流式传输被广泛应用于商业、医疗、政府、社交媒体和移动应用等各个领域。
1.1 数据来源
数据的来源不断增加,如社交媒体、物联网设备、网页点击流、应用程序日志和摄像机等。这些数据通常具有高速度、间歇性和突发性的特点,给大多数系统带来了挑战,因为难以对下游系统进行充分的配置和设计。数据有效负载通常较小,但包含音频或视频数据时除外,并且有多种格式。主要的数据格式有:
- JavaScript对象表示法(JSON) :过去10年中,JSON已成为消息序列化的主要格式。它是一种轻量级的数据交换格式,易于人类读写,基于JavaScript对象语法。它有两种数据结构:哈希表和列表。哈希表由键值对组成,如 {"key":"value"} ,其中键必须唯一;列表是按特定顺序排列的值的集合,如 ["value 1", "value 2"] 。以下是一个示例物联网JSON消息:
{
"deviceid" : "device001",
"eventTime": -192778200,
"temp" : 68.4,
"humidity" : 77.3,
"coords" : {
"latitude" : 32.779039,
"longitude" : -96.8
超级会员免费看
订阅专栏 解锁全文
1264

被折叠的 条评论
为什么被折叠?



