- 博客(16)
- 收藏
- 关注
原创 为何HDFS中不适合存小文件(大数据面试高频三)
HDFS天生就是为了存储大文件而生,一个块的元数据大小大概在150字节左右,存储一个小文件就要占NameNode 150字节的内存,如果存储大量的小文件很快就将NameNode内存耗尽,而整个集群存储的数据量很小,失去了HDFS的意义,同时也会影响NameNode的寻址时间,导致寻址时间过长。可以将数据和并上传,或者将文件append形式追加在HDFS文件末尾。
2022-10-05 16:23:09
490
原创 HDFS中,NameNode,DataNode及SecondaryNameNode的作用(大数据面试高频二)
HDFS中,NameNode,DataNode及SecondaryNameNode的作用
2022-10-05 16:15:45
2502
原创 SparkStreaming的案例及应用(一)
本案例使用SparkStreaming接受处理kafka消费数据,并将处理好的数据写进kafka指定主题
2022-09-26 23:10:53
470
原创 flume+kafka整合采集数据简单应用案例(详解)
本案例使用flume监控源头文件夹下的文件,当有新的文件时,自动采集文件数据到kafka。.flume配置采集文件是核心,配置好source、channel、sink三个组件。
2022-09-24 23:33:21
1094
原创 一步到位 配置环境变量。有关window10安装完jdk,配置环境后检验出现 “ javac不是内部或外部命令,也不是可运行的程序 或批处理文件” 的细节问题
不要瞎看网上的教程!!!配置环境变量过程中变量值千万不能出错!!安装j过程我就不多说了,我从配置环境变量说起。1.打开我的电脑,空白处右击,点击属性,左上角点击 高级系统设置打开页面如下:点击环境变量,在下方系统变量中点击编辑。1.第一步创建 变量名为JAVA_HOM (左方绿色英文可直接复制)其次打开你所安装jdk的文件夹,直接将此处红框中的文件地址复制到变量值中即可(此处地址因人而异)2.第二步创建 变量名为 CLASSPATH(左方绿色英...
2022-03-20 12:39:59
413
原创 初识CSS之选择器
1.什么是CSS?全称:Cascading Style Sheet 层叠样式表层叠:多层,说明可以通过多个样式去表现(可以理解成一个正方体,他中间穿插多层样式)样式:具体的各种修改展示形式的表现。表:表格2.DIVdiv属于块级元素span属于层级元素3. CSS基本语法<style> 选择器{ 声明1 声明2 声明3 ··· }</style>4.三种引入
2022-03-14 12:56:04
647
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人