- 博客(11)
- 收藏
- 关注
原创 Hadoop面试大全【持续更新❤-个人收集用】
块是存储在文件系统最小的单元,如果采用4kb的块大小去存储到HDFS上,就需要大量的块,大大增加寻找块的时间,降低读写效率,并且map喝reduce都是一个块为处理单位,如果块很小会造成MapRduce任务书很多,任务之间开小变大,降低效率。2、元数据开销大,HDFS的元数据存储在NameNode中,每个文件和目录都会有相应的元数据记录,当有大量小文件时,元数据的数量会急剧增加,导致NameNode的内存消耗变大。如果有大量小文件,每个小文件都会占用一个块的存储空间,会造成存储空间的浪费。
2023-11-23 09:17:11
114
原创 Hadoop/Hive/zookeeper问题一解通-通过问答直指面试!
负载均衡是一种计算机网络技术,用来计算计算机集群、网络连接、CPU、磁盘或其他资源中的分配负载,以达到最佳化的资源使用、最大吞吐率、最小相应时间、同时避免过载。Hadoop 3.x的核心组件Hadoop 3.x版本的核心组件有三个,分别是:HDFS、Mapreduce、Yarn为了充分利用数据,第一步是存储数据。Hadoop第一个组件是它的存储单元-Hadoop分布式文件系统,又称之为HDFS。因此,数据分布在许多计算机中并以块的形式存储,每一个块默认容量大小是128MB。
2023-09-20 16:46:02
210
1
原创 SQL面试八股文及手撕代码【更新中】
回答:首先 char 和 varchar 都是是MySQL中字符串类型中的一种基于我的理解,我认为char和varchar的区别有两个基于这些特性,char适合存储很短的字符串,或者所有值都接近同一个长度。例如非常适合存储密码的MD5值,因为这是一个定长的值;varchar适合存储字符串很长,且长短不一、差别很大的值。回答:基于我的理解,我认为MyISAm和InnoDB的区别有四个基于这些特性,在去选择合适的引擎,需要支持事务,那必须去选择InnoDB,如果大多数表操作都是查询,可以选择MyISam。
2023-09-08 10:00:50
338
1
原创 子乌笔记-SQL-窗口函数
窗口函数,又称(OnLine Anallytical Processing),窗口函数,即window functions,是在之后新增的功能,简化了数据分析工作中查询语句的书写。备注:在没有窗口函数前,需要通过定义临时变量和大量的子查询才能完成的工作,使用窗口函数实现起来更加简洁、高效。窗口函数就是对数据表中一组数据进行计算的函数,这组数据跟当前行相关。
2023-09-07 15:09:28
162
1
原创 Linux大学生入门一篇全(基础篇)
内核提供了Linux系统的主要功能,如硬件调度管理的能力。Linux内核是免费开源的,任何人都可以查看内核的源代码,甚至是贡献源代码。
2023-09-01 00:40:55
451
2
原创 子乌笔记-MySQL-数据操作DML篇
DML英文全称是Date Manipulation Language(数据操作语言),用来对数据库中表的增删改操作。
2023-08-21 15:08:03
992
1
原创 子乌笔记-MySQL-数据查询DQL篇
DQL英文全称是Data Query Language(数据查询语言),数据查询语言,用来查询数据库中表的记录。
2023-08-19 17:08:31
227
原创 子乌笔记-MySQL-数据定义DDL篇
DDL 原名 Data Definition Language(数据定义语言),用来定义数据库对象(库、表、字段)
2023-06-06 17:08:06
533
空空如也
easyscheduler参数
2024-01-11
TA创建的收藏夹 TA关注的收藏夹
TA关注的人