- 博客(4)
- 收藏
- 关注
原创 Day3:Hive实操
数据库是面向交易的处理系统(业务系统),它是针对具体业务在数据库联机的日常操作,通常对记录进行查询、修改。用户较为关心操作的响应时间、数据的安全性、完整性和并发支持的用户数等问题。传统的数据库系统作为数据管理的主要手段,主要用于操作型处理,也被称为联机事务处理 OLTP(On-Line Transaction Processing)。::数据仓库一般针对某些主题的历史数据进行分析,支持管理决策,又被称为联机分析处理 OLAP(On-Line Analytical Processing)。
2024-04-24 22:06:16
1218
2
原创 Day2:初步了解Hive
通常是群集中每个节点一个,用于存储数据,负责提供来自文件系统客户端的读写请求。:是管理文件系统命名空间的Master(主服务器),用于管理客户端对文件的访问,执行文件系统命名空间操作,如打开,关闭和重命名文件和目录。:为超大数据集设计了计算/扩展能力(MR作为计算引擎,HDFS作为存储系统),Hive可以自由的扩展集群的规模,一般情况下不需要重启服务。ls -l 显示文件属性,包括大小,日期,符号连接,是否可读写及是否可执行。:Hive支持用户自定义函数,用户可以根据自己的需求来实现自己的函数。
2024-04-23 22:08:15
781
2
原创 Hadoop入门
1)NameNode(nn):存储文件的元数据,如文件名,文件目录结构,文件属性(生成时间、副本数、文件权限),以及每个文件的块列表和块所在的DataNode等。1)Hadoop创始人Doug Cutting,为了实现与Google类似的全文搜索功能,他在Lucene框架基础上进行优化升级,查询引擎和索引引擎。3)对于海量数据的场景,Lucene框架面对与Google同样的困难,存储海量数据困难,检索海量速 度慢。2)DataNode(dn):在本地文件系统存储文件块数据,以及块数据的校验和。
2024-04-22 22:06:16
593
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人