
数据库系统
没有人比我更懂暴力算法
计算机专业博士僧,JAVA语言忠实粉丝,研究方向:数据挖掘&算法。
展开
-
HDFS简介
一、HDFS概念HDFS (Hadoop Distributed File System)指适合运行在通用硬件上的分布式文件系统二、HDFS特点和特性现有的分布式文件系统有很多共同点。但同时,它和其他的分布式文件系统的区别也是很明显的。1. 高容错性适合部署在廉价的机器上2. 高吞吐量为大量数据访问的应用提供高吞吐量支持3. 大文件存储支持存储TB-PB级别的数据HDFS适用于大文件存储、流式数据访问,适合那些有着超大数据集(large data set)的应用程序;不适合大量小原创 2020-08-11 16:05:24 · 2629 阅读 · 0 评论 -
XML 简介
一、什么是 XML?XML 指可扩展标记语言(EXtensible Markup Language)XML 是一种标记语言,很类似 HTML。二、XML 与 HTML 的主要差异XML被设计用来传输和存储数据。HTML 被设计用来显示数据。XML 旨在传输信息,其焦点是数据的内容。HTML 旨在显示信息,其焦点是数据的外观。三、XML的特性1.XML 是不作为的,不会做任何事情。XML 被设计用来结构化、存储以及传输信息。2. XML 仅仅是纯文本。有能力处理纯文本的软件都可以原创 2020-08-11 11:36:26 · 142 阅读 · 0 评论 -
MapReduce原理简介
一、MapReduce是什么MapReduce是一种分布式计算框架 ,以一种可靠的,具有容错能力的方式并行地处理上TB级别的海量数据集。主要用于搜索领域,解决海量数据的计算问题。MapReduce有两个阶段组成:Map和Reduce,用户只需实现map()和reduce()两个函数,即可实现分布式计算。二、MapReduce做什么MapReduce框架由Map和Reduce组成。Map()负责把一个大的block块进行切片并计算。Reduce() 负责把Map()切片的数据进行汇总、计算。原创 2020-08-11 11:19:55 · 369 阅读 · 0 评论