
大数据
文章平均质量分 61
吃胡萝卜的鳄鱼
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
hive查询s3外部表报java.lang.NoClassDefFoundError错误解决
hive查询外部表 报错 Error: java.lang.NoClassDefFoundError: com/amazonaws/services/s3/model/MultiObjectDeleteException (state=,code=0)原创 2022-05-17 17:09:35 · 1108 阅读 · 0 评论 -
pulsar commiter问与答
>>> 问题1: 核心组件中,不是说去Zookeeper嘛?目前所有的发行版中还没有去掉zookeeper的版本,可能会在2.9.0发布去掉zookeeper的版本,去zookeeper是 Pulsar Hackathon 的一个项目,后面会有更多的内容出来>>>问题2: pulsar新增broker的时候,是如何去别的broker里面拿topic的呢?这个负载均衡过程是怎么样的? 以及在重新分配broker的topic的时候,producer和consumer会原创 2021-05-16 17:51:24 · 636 阅读 · 0 评论 -
[ERROR][org.logstash.Logstash ] java.lang.IllegalStateException: Logstas 报错解决
[2020-06-03T13:52:19,226][FATAL][logstash.runner ] Logstash could not be started because there is already another instance using the configured data directory. If you wish to run multiple instances, you must change the "path.data" setting.[2020-原创 2020-06-03 14:14:07 · 6932 阅读 · 0 评论 -
Flink之CEP(复杂事件处理)
CEP概述复杂事件处理(Complex Event Processing,CEP)FLink CEP是在Flink中实现的复杂事件处理(CEP)库CEP允许在无休止的事件流中检测事件模式,让我们有机会掌握数据中重要的部分一个或多个由简单事件构成的事件流通过一定的规则匹配,然后输出用户想要得到的数据-=-满足规则的复杂事件...原创 2020-05-27 22:27:15 · 2717 阅读 · 1 评论 -
FLink DataStream开发之Time与Window
TimeFlink 流式处理中,存在时间的不同概念Event Time: 事件的创建时间,通常由事件中的时间戳描述,相当于食品的生产日期Ingestion Time:数据进入flink的时间,相当于食品快递到你家的时间Processing Time:是每个执行基于时间操作的算子的本地系统时间,与机器相关 ,默认的时间属性就是 Processing Time ,相当于你吃到汉堡的时间通过...原创 2020-04-26 16:31:34 · 1028 阅读 · 0 评论 -
flink Datastream之自定义connector
flink Datastream自定义source和sink,主要以mysql为例子原创 2020-04-21 16:06:09 · 1331 阅读 · 0 评论 -
filebeat采集一台服务器中的不同日志,并将日志放到ES中的不同索引中
filebeat.inputs:- type: log enabled: true paths: ?- /usr/local/tomcat/apache-tomcat-8.5.53/logs/catalina.out tags: ["tomcat"] fields: index: "tomcat"- type: log enabled: true pa...原创 2020-04-17 13:24:49 · 1939 阅读 · 0 评论 -
Flink 批处理之DataSet(source、sink、Transformation)
介绍flink批处理开发流程,以及各类常用source&sink详细原创 2020-03-31 11:02:02 · 1930 阅读 · 0 评论 -
错误解决java.lang.NoClassDefFoundError: org/apache/hadoop/fs/FSDataInputStrea和Under-Replicated Blocks
错误解决java.lang.NoClassDefFoundError: org/apache/hadoop/fs/FSDataInputStrea和Under-Replicated Blocks原创 2020-03-20 15:52:18 · 2680 阅读 · 0 评论 -
centos&离线安装Cloudera Manager6.3.1 和CDH6.3.1
1.环境准备2.下载所需资源https://archive.cloudera.com/cm6/6.3.1/redhat7/yum/RPMS/x86_64/cloudera-manager-daemons-6.3.1-1466458.el7.x86_64.rpmhttps://archive.cloudera.com/cm6/6.3.1/redhat7/yum/RPMS/x86_64/clo...原创 2020-03-08 21:59:40 · 2968 阅读 · 0 评论 -
centos7离线手动安装与完全卸载mysql-5.7(19年8月7日修改)
centos离线安装mysql原创 2017-11-21 17:19:19 · 4375 阅读 · 0 评论 -
解决flink启动后无法正常关闭
flink集群无法正常关闭使用命令stop-cluster.sh关闭flink集群的时候出现以下错误,No taskexecutor daemon to stop on host tanghc-X550JX.No standalonesession daemon to stop on host tanghc-X550JX.原创 2019-10-10 09:29:59 · 5942 阅读 · 7 评论 -
flink打包程序提交任务示例
工具maven、idea、flink1.9-2.11scala代码pom.xml<?xml version="1.0" encoding="UTF-8"?><project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-inst...原创 2019-10-08 17:11:59 · 1037 阅读 · 2 评论 -
Flink简介以及与sparkStreaming和Storm比较
Apache Flink 是一个开源的分布式,高性能,高可用,准确的流处理框架。对比另外俩主流的实时计算框架,Flink有着独特的魅力原创 2019-09-30 14:36:56 · 961 阅读 · 0 评论 -
Hive概述、安装部署、mysql集成与测试
1. Hive概述1.什么是hive?由Facebook开源用于解决海量结构化日志得数据统计;Hive是基于Hadoopde的一个数据仓库工具,可以将结构化的数据文件映射成一张表,并用提供类SQL查询功能;构建在Hadoop之上的数据仓库;使用HQL作为查询接口;使用HDFS储存;使用MapReduce计算;本质是:将HQL转化为Mapreduce程序灵活性和拓展性比较好:支持...原创 2019-03-17 14:07:47 · 324 阅读 · 0 评论 -
centos安装HUE
HUE-3.9.0-cdh5.5.0.tar.gz下载地址:https://archive.cloudera.com/cdh5/cdh/5/hue-3.9.0-cdh5.5.0.tar.gz解压tar -zxf hue-3.9.0-cdh5.5.0.tar.gz根据官网提示安装相关依赖包(我是centos6.4)yum install ant asciidoc cyrus-sasl-d...原创 2019-03-20 17:21:07 · 769 阅读 · 0 评论 -
hadoop2.x HA搭建以及相关错误解决
集群节点安排安排节点名bigdata-pro01.kfk.combigdata-pro02.kfk.combigdata-pro02.kfk.comnamenodenamenodedatanodedatanodedatanode配置hdfs-site.xml<?xml version="1.0" encoding="UTF-8"?&...原创 2019-03-14 18:22:41 · 336 阅读 · 0 评论 -
Flink on yarn集群HA配置
1.集群规划Flink on yarn 的HA其实是利用yarn自己的恢复机制。在这里需要用到ZK,主要是因为虽然flink-on-yarn cluster HA 依赖于Yarn自己的集群机制,但是在Flink job在恢复时,需要依赖检查点产生的快照,而这些快照虽然配置在hdfs,但是其元数据信息保存在zookeeper中,所以我们还要配置zookeeper的信息hadoop集群:mast...原创 2019-01-17 20:37:55 · 2177 阅读 · 0 评论