
dsj
xuqian1638
菜鸟多飞︿( ̄︶ ̄)︿
展开
-
Azkaban安装
1.Azkaban介绍 1. Azkaban是由Linkedin公司推出的一个批量工作流任务调度器,主要用于在一个工作流内以一个特定的顺序运行一组工作和流程,它的配置是通过简单的key:value对的方式,通过配置中的dependencies 来设置依赖关系,这个依赖关系必须是无环的,否则会被视为无效的工作流。Azkaban使用job配置文件建立任务之间的依赖关系,并提供一个易于使用的web用...原创 2019-12-04 17:37:24 · 317 阅读 · 0 评论 -
Hive、HBase、Impala的简单对比
1.什么是实时分析(在线查询)系统?大数据领域里面,实时分析(在线查询)系统是最常见的一种场景,通常用于客户投诉处理,实时数据分析,在线查询等等过。因为是查询应用,通常有以下特点:a.时延低(秒级别)。b.查询条件复杂(多个维度,维度不固定),有简单(带有ID)。c.查询范围大(通常查询表记录在几十亿级别)。d.返回结果数小(几十条甚至几千条)。e.并发数要求高...转载 2019-03-14 22:47:27 · 441 阅读 · 0 评论 -
elasticsearch-head的使用
ealsticsearch只是后端提供各种api,那么怎么直观的使用它呢?elasticsearch-head将是一款专门针对于elasticsearch的客户端工具elasticsearch-head配置包,下载地址:https://github.com/mobz/elasticsearch-headelasticsearch-head是一个基于node.js的前端工程,启动elasti...转载 2019-03-21 15:32:15 · 269 阅读 · 0 评论