- 博客(2)
- 收藏
- 关注
原创 结构化数据、半结构化数据和非结构化数据
Structured data is organized into entities that have a defined format, such as XML documents or database tables that conform to a particular predefined schema. This is the realm of the RDBMS. Semi-str...
2018-03-12 14:50:17
703
原创 Hadoop存储系统——基本概念及通信协议简介
Hadoop是一个分布式系统,其包括两大核心内容,一个是并行计算框架MapReduce,另一个就是分布式存储系统HDFS了。从分布式系统理论的角度考虑,一般的分布式系统需要考虑的核心问题包括:数据分块、元数据管理、高可靠性、高可用性、高可扩展性、容错控制、高吞吐量以及高传输等问题;从架构上来讲主流模型是P2P模型和主从结构模型,对外来讲只需要暴露一个统一的访问接口、对用户透明,而且要保护用户数据的...
2018-03-09 13:38:50
737
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人