
技术随笔
未分类技术
大数据技术架构
Focus on Lakehouse
展开
-
大数据之数据交换和存储序列化利器 Avro
Avro(读音类似于[ævrə])是Hadoop的一个子项目,由Hadoop的创始人Doug Cutting(也是Lucene,Nutch等项目的创始人)牵头开发。Avro是一个基于二进...转载 2020-05-29 08:31:35 · 653 阅读 · 0 评论 -
一文彻底搞懂 CMS GC 参数配置
近期整理多个 HBase 集群的 JVM 参数,发现都是默认的 CMS GC 配置,如何调优 JVM 参数就成了一个绕不过的话题。因此,为了寻求一个 CMS GC 的 J...原创 2019-11-19 11:06:58 · 1594 阅读 · 0 评论 -
基于Telegraf+Influxdb+Grafana的监控平台介绍
最近在做大数据监控平台的方案调研,做了一些开源解决方案的尝试,今天分享一下基于Telegraf+InfluxDB+Grafana的监控平台整体部署过程。文章开始会简单介绍下 TICK 技术栈,接下来就是本次方案各个组件的安装部署了。希望对正在调研大数据监控平台或对监控系统感兴趣的同学有所帮助。我们知道这种监控平台的数据特征一般都是时间序列数据(简称 时序数据),那么...原创 2019-09-04 17:02:00 · 1114 阅读 · 0 评论 -
大数据正当时,理解这几个术语很重要
目前,大数据的流行程度远超于我们的想象,无论是在云计算、物联网还是在人工智能领域都离不开大数据的支撑。那么大数据领域里有哪些基本概念或技术术语呢?今天我们就来聊聊那些避不开的大数据技术术语,梳理并补充我们对大数据的理解。01离线计算 Vs 实时计算离线计算离线计算,通常也称为“批处理”,表示那些离线批量、延时较高的静态数据处理过程。离线计算适用于实时...原创 2019-08-21 19:15:31 · 1726 阅读 · 0 评论 -
关于NoSQL,看这篇就够了
欢迎订阅微信公众号:大数据技术架构,更多大数据基础架构,原理与实践,社区动态等。一、NoSQL 介绍NoSQL(Not only SQL)数据库,可以理解为区别于关系型数据库如mysql、oracle等的非关系型数据库。聊到NoSQL不得不提著名的CAP理论,全称 Consistency Available and Partition tolerance,即一致性(C)、可...原创 2019-07-16 08:31:07 · 318 阅读 · 0 评论 -
聊一聊分布式对象存储解决方案
OSS(Object Storage Service)俗称对象存储,主要提供图片、文档、音频、视频等二进制文件的海量存储功能。本文列举了常见的开源方案:原创 2019-05-11 09:42:43 · 3491 阅读 · 0 评论