【Flink流式计算框架】:基本概念(一)

1.Flink简介

  1. 高吞吐、低延迟、高性能
  2. 支持带事件时间的窗口(window)操作:time、count、session、data-driven
  3. 支持有状态计算的exactly once语义
  4. 支持具有反压功能的持续流模型
  5. 支持基于轻量级分布式快照(snapshot)实现的容错
  6. 同时支持batch on streaming处理和Streaming处理
  7. Flink在JVM内部实现了自己的内存管理
  8. 支持迭代计算
  9. 支持程序自动优化:避免特定情况下shuffle、排序等昂贵操作,中间结果有必要时缓存

 

1.1Flink的重要特点

1.事件驱动型(Event-driven)

它从一个或多个事件流提取数据,并根据到来的事件触发计算、状态更新或其他外部动作。比较典型的就是以kafka为代表的消息队列几乎都是事件驱动型应用。

事件驱动应用程序的典型场景包括:

实时推荐(例如,在客户浏览零售商网站时推荐产品)
       行为模式检测或复杂事件处理(例如,用于信用卡交易中的欺诈检测)
       异常检测(例如,检测侵入计算机网络的尝试

2.流与批统一处理

3.分层api

分为三层。顶级 SQL/TABLE API 越顶层越抽象,表达含义越简明,使用越方便 越底层越具体,表达能力越丰富,使用越灵活

  • DataSet:对静态数据进行批处理操作、将静态数据抽象成分布式数据集,使用Flink各种操作符处理数据集,支持Java、Scala、Python
  • DataStream:对数据流进行流处理操作,将流式的数据抽象成分布式数据流,用Flink各种操作符处理数据流,支持Java、Scala
  • Table API:对结构化数据进行查询操作,将结构化数据抽象成关系表。并通过类SQL的DSL对关系表进行各种查询操作,支持Java、Scala
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值