大数据
文章平均质量分 90
DK_ing
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
ILM(Index Lifecycle Management)
目录概念概述ILM触发行为RolloverShrinkForce mergeFreezeDelete索引生命周期阶段概念阶段执行索引生命周期行为AllocateDeleteForce mergeFreezeMegrateRead OnlyRolloverSearchable snapshotSet priorityShrinkUnfollowWait for snapshot实践概念概述ILM触发行为原创 2021-03-05 16:41:12 · 1244 阅读 · 0 评论 -
大数据大纲
1、Java编程技术Java编程技术是大数据学习的基础,Java是一种强类型语言,拥有极高的跨平台能力,可以编写桌面应用程序、Web应用程序、分布式系统和嵌入式系统应用程序等,是大数据工程师最喜欢的编程工具,因此,想学好大数据,掌握Java基础是必不可少的。2、Linux命令对于大数据开发通常是在Linux环境下进行的,相比Linux操作系统,Windows操作系统是封闭的操作系统,开...原创 2019-05-18 17:27:20 · 795 阅读 · 0 评论 -
ELK日志系统
作为系列文章的第四篇,本文将重点探讨数据采集层中的ELK日志系统。日志,指的是后台服务中产生的log信息,通常会输入到不同的文件中,比如Django服务下,一般会有nginx日志和uWSGI日志。这些日志分散地存储在不同的机器上,取决于服务的部署情况了。如果我们依次登录每台机器去查阅日志,显然非常繁琐,效率也很低,而且也没法进行统计和检索。因此,需要对日志进行集中化管理,将所有机器上的日志信息收集...转载 2019-06-13 09:03:03 · 2254 阅读 · 0 评论 -
史上最全的“大数据”学习资源
目录关系数据库管理系统(RDBMS)框架分布式编程分布式文件系统文件数据模型Key Map数据模型键-值数据模型图形数据模型NewSQL数据库列式数据库时间序列数据库类SQL处理数据摄取物联网和传感器文章推荐论文2015 - 20162013 - 20142011 - 20122001 - 2010视频...转载 2019-06-13 09:15:06 · 396 阅读 · 0 评论 -
基于Azkaban的任务定时调度实践
一、Azkaban介绍Azkaban是LinkedIn开源的任务调度框架,类似于JavaEE中的JBPM和Activiti工作流框架。Azkaban功能和特点:1,任务的依赖处理。2,任务监控,失败告警。3,任务流的可视化。4,任务权限管理。常见的任务调度框架有Apache Oozie、LinkedIn Azkaban、Apache Airflow、Alibaba Ze...转载 2019-06-27 17:18:11 · 1418 阅读 · 0 评论
分享