使用flume替代原有的scribe服务

最新推荐文章于 2024-11-29 14:37:26 发布

weixin_34327223

最新推荐文章于 2024-11-29 14:37:26 发布

阅读量92

点赞数

CC 4.0 BY-SA版权

文章标签：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_34327223/article/details/85212919

本文详细介绍了如何将使用Scribe进行日志收集的配置迁移到Flume，包括配置调整、理解Flume特性以及迁移过程中的注意事项。重点强调了Flume在机器上编译成本较低、官方支持稳定的优势，以及Flume 1.6新特性对Kafka的支持和数据内容正则过滤的实用性。

以前很多业务都是用scribe做日志收集的支撑的，后来fb停止了对scribe的开发支持。而且scribe在机器上编译一次的代价太大了，各种坑，正好后来flume从1.3.0开始加入了对scribe的支持。就可以把原来scribe上面接入的数据转用flume收集了。虽然我很喜欢scribe，但是失去了官方支持毕竟还是很闹心的。

agent.channels=c1
agent.channels.c1.capacity=20000
agent.channels.c1.transactionCapacity=10000
agent.channels.c1.type=memory
agent.sinks=k1
agent.sinks.k1.channel=c1
agent.sinks.k1.hdfs.batchSize=8000
agent.sinks.k1.hdfs.filePrefix=log
agent.sinks.k1.hdfs.fileType=DataStream
agent.sinks.k1.hdfs.path=hdfs://NNHA/data/flume/%{category}/%Y%m%d
agent.sinks.k1.hdfs.rollCount=0
agent.sinks.k1.hdfs.rollInterval=86400
agent.sinks.k1.hdfs.round=true
agent.sinks.k1.hdfs.roundUnit=minute
agent.sinks.k1.hdfs.roundValue=1
agent.sinks.k1.hdfs.serializer.appendNewline=false
agent.sinks.k1.hdfs.useLocalTimeStamp=true
agent.sinks.k1.hdfs.writeFormat=TEXT
agent.sinks.k1.type=hdfs
agent.sources=r1
agent.sources.r1.channels=c1
agent.sources.r1.host=0.0.0.0
agent.sources.r1.port=1463
agent.sources.r1.type=org.apache.flume.source.scribe.ScribeSource
agent.sources.r1.workerThreads=5

主要是serializer.appendNewline设置为false，否则会每条自动添加一个回车上去，其他也没什么太多好解释的，用过flume的自然秒懂，hdfs.path里面，%{category}就是意味着原来scribe里面的category。

flume 1.6的新特性里面是加入了对kafka的source和sink的支持，以及对数据内容的正则过滤传递，这点很有用，貌似下个月或者下下个月会有本关于flume的新书上市。

weixin_34327223

博客等级

码龄9年

141
原创

263
点赞

1481
收藏

4760
粉丝

关注

私信

热门文章

上一篇：: Android开发（二十六）——Application

下一篇：: 树形DP Gym 100496H House of Representatives

最新评论

二进制的原码、反码和补码
做而论道_CS: 所谓的：机器数符号位原码反码取反加一符号位不变 ... 都是计算机专家在【卖拐】而已。正负数值，存入计算机，都是以 “补码” 存放的。计算机中，根本就没有原码和反码。除非，你自寻烦恼，偏要在计算机中，存入原码和反码。既然没有原码反码，那么，取反加一，计算机也就做不到了。其实，所谓的 “补码”，并不是什么 “码”，也是正常的数字。　而且，也不一定是二进制数。你看十进制的加法：27 + 99 = (一百) 26。如果你忽略进位，依旧保持两位数，这就成了减法运算：27 － 1 = 26。因为你舍弃了进位（即减去 100），减法才会出现。加 99，再减去 100，当然就是－1 ！结论：舍弃了进位，负数，就能用正数代替；舍弃了进位，加法，竟然就能实现减法运算！由此可知，“补码”，根本就不是什么新鲜事。补码的来源，是【舍弃进位】！　小学生，都懂这个。根本就不是什么：符号位原码反码取反加一。这些，就像刘谦变戏法用的“障眼法”，一句真话也没有！－－－－－－－－－－－－计算机用二进制数。八位二进制数是：0000 0000 ~ 1111 1111。相当于十进制数：0 ~ 255。如果出现 “进位 = 1”，就是：2^8 = 256。此时，加 255，再减 256，这也就是 “－1” 了。所以：+255 (1111 1111)，就是：－1；同理：+254 (1111 1110)，就是：－2；　　　+253 (1111 1101)，就是：－3；　　　。。。　。。。　　　+128 (1000 0000)，即：－128。以上这些正数，就是计算机专家 “发明” 的补码了。你会看出来：负数的补码 = 256 + 该负数。一般化就是：负数的补码 = 2^n + 该负数。　n，是二进制数的位数。同理，正数的补码，也是：2^n + 该正数。但是，式中的 2^n 就是一个进位，可以舍弃的。所以，正数的补码，就是：该正数本身。例：求－31 的 “补码” 是多少？解：256－31 = 225 = 1110 0001 (二进制)。　这不就求出来了吗？　　哪还用琢磨什么：符号位原码取反。。。！求补码，不过是一道小学算术题而已。谁要是跟老外学算术，　立刻、马上、直接，就拐到沟里去了！
【.NET深呼吸】应用上下文（AppContext）
默念Mony: 关注博主可以查看全文，点开告诉我中秋别吃太多月饼，三高...哈哈哈哈哈哈太逗了
centos7虚拟机安装出现license information
码到成龚: 为啥会出现需要同意许可信息的提示，以前我都没有遇到过，真头秃。
centos7虚拟机安装出现license information
码到成龚: 进去是进去了，就是出现了另外一个问题：“oh no ,something has gone wrong ”
【实战】通过 JS 将 HTML 导出为 PDF 文档
ʚ 如花本花 ɞ: 引用「landscape」第一页和第二页直接被截断了咋处理啊

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。