
大数据
2Tree
专注后端开发
展开
-
hadoop 各种概念整理
转自:https://blog.youkuaiyun.com/qq_26437925/article/details/78467216 http://hadoop.apache.org/ Hadoop Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。 HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它...转载 2018-12-24 10:10:27 · 348 阅读 · 0 评论 -
Apache Flink
Apache Flink是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。Flink设计为在所有常见的集群环境中运行,以内存速度和任何规模执行计算。 在这里,我们解释了Flink架构的重要方面。 处理无界和有界数据 任何类型的数据都是作为事件流产生的。信用卡交易,传感器测量,机器日志或网站或移动应用程序上的用户交互,所有这些数据都作为流生成。 数据可以作为无界或有界流处理。...翻译 2019-01-07 11:50:56 · 234 阅读 · 0 评论