
大数据
文章平均质量分 97
主要总结大数据有关的技术栈
mkfka
这个作者很懒,什么都没留下…
展开
-
谁来跟我聊10毛钱的分布式全文搜索引擎——Elasticsearch
这里写目录标题一级目录二级目录三级目录一级目录二级目录三级目录原创 2020-12-05 15:57:34 · 246 阅读 · 0 评论 -
谁来跟我聊9毛钱的分布式消息队列——kafka
分布式消息队列——kafkakafka架构kafka工作流程及文件存储kafka生产者kafka消费者kafka高效读写数据zookeeper在kafka中的作用kafka事务常见问题kafka的日志目录结构?如何根据offset找到对应消息?kafka Controller的作用?kafka哪些设计让它有如此高的性能?kafka分区分配策略kafka消息数据积压,kafka消费能力不足怎么处理?kafka架构kafka工作流程及文件存储kafka生产者kafka消费者kafka高效读写数据z.原创 2020-12-03 21:11:04 · 264 阅读 · 0 评论 -
谁来跟我聊8毛钱的列式存储Nosql——HBase
列式存储Nosql——HBaseHbase介绍Hbase与RDBMS比较Hbase与HDFS比较Hbase与Hive比较Hbase数据模型表(table)行(row)列簇(Column Family)列标识符(Column Qualifier)单元格(Cell)Hbase架构Hbase架构解析Hbase读写过程Hbase二级索引Hbase的过滤器类型Hbase优化Row key的设计列簇的设计常见问题为什么要按列存储?按列存储有什么好处?Hbase介绍HBase是BigTable的开源java版本。是.原创 2020-11-26 15:48:02 · 251 阅读 · 0 评论 -
谁来跟我聊7毛钱的分布式缓存——redis
分布式缓存——redisredis概述redis的数据类型stringhashsetlistzsetredis的持久化RDBAOFredis的事务redis的过期策略定时过期惰性过期定期过期redis的淘汰策略redis的高可用主从复制哨兵模式redis集群redis常见问题缓存穿透缓存击穿缓存雪崩redis概述redis的数据类型stringhashsetlistzsetredis的持久化RDBAOFredis的事务redis的过期策略定时过期惰性过期定期过期redis的淘原创 2020-11-20 10:00:07 · 214 阅读 · 3 评论 -
谁来跟我聊6毛钱的数据仓库——hive
数据仓库——hive数据仓库的概念数据仓库与数据库的区别数据仓库的分层架构hive工作流程将sql解析为MapReducehive表的类型管理表内部表外部表hive表的结构分区表分桶表hive中的join与排序join排序hive的优化hive中的数据倾斜数据仓库的概念数据仓库与数据库的区别数据仓库的分层架构hive工作流程将sql解析为MapReducehive表的类型管理表内部表外部表hive表的结构分区表分桶表hive中的join与排序join排序hive的优化hiv原创 2020-11-17 15:04:50 · 438 阅读 · 0 评论 -
谁来跟我聊五毛钱的分布式计算框架——MapReduce?
分布式计算框架——MapReduce一级目录二级目录三级目录一级目录二级目录三级目录原创 2020-11-04 10:34:16 · 479 阅读 · 0 评论 -
谁来跟我聊四毛钱的分布式资源管理与任务调度框架——YARN?
YARN——分布式资源管理与任务调度框架YARN的架构与运行机制YARN的架构ResourceManager管理节点NodeManager计算节点YARN的运行机制YARN的资源管理与任务调度YARN的资源管理YARN的任务调度机制FIFO调度器(FIFO Scheduler)容量调度器(Capacity Scheduler)公平调度器(Fair Scheduler)YARN的架构与运行机制YARN是hadoop的集群资源管理系统。YARN被引入hadoop2,最初是为了改善MapReduce的实现,但原创 2020-10-26 22:18:55 · 214 阅读 · 1 评论 -
谁来跟我聊三毛钱的分布式存储系统——HDFS?
这里写目录标题一级目录二级目录三级目录一级目录二级目录三级目录原创 2020-10-25 12:54:27 · 325 阅读 · 1 评论 -
谁来跟我来聊两毛钱的Hadoop?
hadoop HA架构一级目录二级目录三级目录一级目录二级目录三级目录原创 2020-10-22 14:29:09 · 159 阅读 · 0 评论 -
谁来跟我来聊个一毛钱的 Zookeeper ?
Zookeeper内容详解一、什么是Zookeeper?1.1 文件系统1.2 watch监听机制二、zookeeper的特性三、zookeeper的集群角色四、zookeeper的节点类型五、zookeeper的选举机制六、常见问题1、什么是脑裂?Zookeeper是怎么解决脑裂问题的?2、为什么集群最好是奇数?为什么集群数量要大于3?在了解Zookeeper之前,我们来先了解一下,在大数据中,集群与分布式的区别。分布式(distributed是指在多台不同的服务器中部署不同的服务模块,通过远程调用.原创 2020-10-21 00:10:21 · 146 阅读 · 0 评论