
数据平台
grantpole
最怕一生碌碌无为 还安慰自己平凡可贵
展开
-
InfluxDB—Docker安装部署influxdb以及用户认证登陆设置
使用Docker一键安装部署influxdb以及用户认证登陆配置!原创 2020-11-17 21:17:20 · 11879 阅读 · 1 评论 -
InfluxDB—数据保留策略(Retention Policies)介绍
InfluxDB—数据保留策略(Retention Policies)详解!原创 2020-11-17 09:29:33 · 7798 阅读 · 0 评论 -
Flink中的时间语义和Watermarks
详细介绍Flink的Event Time、Processing Time和Ingestion Time三种时间语义以及Event Time和Watermark的工作机制!原创 2020-11-12 14:09:58 · 1735 阅读 · 0 评论 -
Spark Streaming (一)| Spark,从入门到精通
Spark Streaming 是批处理的流式实时计算框架,支持从多种数据源获取数据,如 Kafka、TCP sockets、文件系统等。它可以使用诸如 map、reduce、join 等高级函数进行复杂算法的处理,最后还可以将处理结果存储到文件系统,数据库等。原创 2020-07-29 16:00:47 · 1158 阅读 · 0 评论 -
MapReduce 简介
一、 MapReduce:计算框架和编程模型今天我们来聊聊一个比较基础也比较重要的内容 MapReduce,说它基础,是因为它诞生的时间实在是太久远了,并不是什么新东西,说它重要则是因为基于它的提出衍生出很多重要的技术,比如我们关心的 Spark。今天的内容主要有以下几点:Google 的三驾马车;MapReduce 编程模型与 MapReduce 计算框架;并发与并行;如何理解分布式计算框架的编程接口与背后的工程实现。1. Google 的三驾马车USNew 把计算机科学分为 4 个领转载 2020-07-27 22:15:45 · 3838 阅读 · 0 评论 -
HDFS 常用命令使用教程与架构简介
HDFS 常用命令使用教程,10分钟入门!原创 2020-07-10 16:59:11 · 1258 阅读 · 0 评论 -
使用隐藏的 REST API 提交 SPARK 任务
提交spark任务的两种方式: spark-submit 以及隐藏的rest api 。原创 2020-01-15 13:29:27 · 1642 阅读 · 1 评论 -
Apache Flume 入门教程
Apache Flume 入门教程,一文带你了解Apache Flume 数据接入的各种方式!原创 2019-09-07 11:33:05 · 1203 阅读 · 0 评论