
大数据
字节侠
这个作者很懒,什么都没留下…
展开
-
Flink2支持提交StreamGraph到Flink集群
最近研究Flink源码的时候,发现Flink已经支持提交StreamGraph到集群了,替换掉了原来的提交JobGraph。Flink2还移除了Per-Job的部署模式。原创 2025-01-31 20:17:52 · 756 阅读 · 0 评论 -
将spark输出到hdfs的文本数据压缩成gzip格式
适合Spark SQL和Spark Structured Streaming直接上代码SparkSession spark = SparkSession .builder() .appName("spark-job") .getOrCreate();RuntimeConfig conf = spa...原创 2020-04-01 18:00:43 · 2673 阅读 · 0 评论 -
将flink输出到hdfs的数据压缩成gzip格式
将flink输出到hdfs的数据压缩成gzip格式CompressionOutputStreamWrapper.classimport org.apache.hadoop.io.compress.CompressionOutputStream;import java.io.Serializable;public class CompressionOutputStreamWrapper ...原创 2019-08-14 15:30:56 · 2539 阅读 · 5 评论 -
Spark对多HDFS集群Namenode HA的支持
具体的配置需要参考core-site.xml和hdfs-site.xmlval sc = new SparkContext()// 多个HDFS的相同配置sc.hadoopConfiguration.set("fs.defaultFS", "hdfs://cluster1", "hdfs://cluster2");sc.hadoopConfigu原创 2018-10-16 19:19:19 · 1233 阅读 · 0 评论 -
Hive使用ORC存储的问题
类型问题: count distinct(case when num > 0 then id else null end) 问题 如果num<=0,就返回null,正常情况下这个结果为0,但是,如果id类型为bigint,那这个结果为1(错误) 解决 更改为:cast(id as string) count distinct(case when num > 0 the...原创 2018-04-18 17:44:05 · 1264 阅读 · 0 评论 -
Flume NG与MySQL整合开发
flume整合MySQL原创 2016-04-14 15:06:54 · 3383 阅读 · 2 评论 -
Ambari告警邮件配置
Ambari告警邮件配置原创 2016-10-18 14:50:36 · 3759 阅读 · 1 评论 -
Ambari删除节点
Ambari删除节点原创 2016-09-27 10:02:01 · 6535 阅读 · 3 评论 -
Kafka使用ambari安装遇到的问题
Kafka使用ambari安装遇到的问题原创 2016-09-21 16:11:28 · 5261 阅读 · 0 评论 -
ganglia与nagios组合使用
1.复制check_ganglia.py到/usr/lib64/nagios/pluginscheck_ganglia.py(自行修改的,官方的有BUG) “`!/usr/bin/env pythonimport sys import getopt import socket import xml.parsers.expatclass GParser: def init(self,原创 2016-05-20 15:37:29 · 1231 阅读 · 0 评论 -
ganglia安装和配置
1.安装依赖yum -y install httpd-devel automake autoconf libtool ncurses-devel libxslt groff pcre-devel pkgconfig2.安装ganglia-gmetad 和 ganglia-webyum search gangliayum install -y ganglia-gmetad.x86_64 gangli原创 2016-05-20 15:20:45 · 451 阅读 · 0 评论 -
nagios安装和配置
nagios安装和配置原创 2016-05-20 15:35:22 · 507 阅读 · 0 评论 -
Sqoop增量导入Hive
欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl原创 2015-12-22 10:51:25 · 10412 阅读 · 0 评论