- 博客(17)
- 收藏
- 关注
原创 HDFS高扩展机制
故障类型:硬件故障、软件故障、人为操作不当、机房断电、机房空调停机、机房网络拥塞可用性:99.9%,全年8.76小时不可用;99.99%,全年52.6分钟不可用;99.999%,全年5.26分钟不可用(难度高)
2022-08-07 11:28:33
628
原创 HDFS原理与应用
HDFS是Hadoop分布式文件系统(Hadoop Distributed File System),分布式文件系统有大容量、高可靠和低成本的特点
2022-08-05 13:23:20
1105
转载 Presto架构原理
Presto是Facebook开源的查询分析引擎,在国内京东用的比较成熟。Presto数据处理能力到达PB级别,支持查询数据源有Hive、Kafka、Cassandra、Redis、Mongodb、SQL server等,在工作应用当中,Presto的查询性能比Hive要高40%以上。...
2022-08-03 15:53:00
341
原创 Spark原理
Spark 是一种与 Hadoop 相似的开源集群计算环境,Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。
2022-07-31 17:55:05
664
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人