
大数据
文章平均质量分 89
RuningSun
这个作者很懒,什么都没留下…
展开
-
Flume 基础知识
一:flume分布式数据收集框架、易扩展、可靠、高可用、可定制化,并且可对数据进行简单处理最简单元是Agent。Agent本身是一个java进程。运行在日志收集节点(服务器节点)。将收集的数据封装成一个event进行传输。二:agentagent包含三个核心组件:source,channel,sink。source:source组件专门用来收集数据的。负责将数据捕获后进...原创 2018-08-11 10:23:38 · 1594 阅读 · 0 评论 -
Flume 消息重复
Flume提供至少一次保证,事件至少被存储一次。有些场景会导致Flume最终会不只一次存储数据。例如,RPC调用可以设置超时时间,若在超时时间内没有得到相应,及时RPC没有失败,也会被认为失败,从而引发重试。若RPC没有失败,重试将导致相同事件再次发生。造成这数据存储端数据重复。例如:Flume source可以写入多个Channel,若相同的source配置了多个Channel,并存...原创 2018-08-11 10:46:05 · 3364 阅读 · 0 评论 -
Flume Source
SourceSource用于从外部系统或其他Agent(或自身产生)接收数据。并将数据写入到一个或多个cahnnel中。Source可以接受任何来源的数据。Source需要通过配置文件配置,保证至少有一个Channel连接,有一个定义type的参数。生命周期系统配置一旦验证通过,source就会被实例化,并且由ConfigurationProvider进行配置。如果缺少配置...原创 2018-08-11 20:35:33 · 280 阅读 · 0 评论