大数据与Hadoop技术全解析
大数据的特性
大数据正日益成为数据管理领域的焦点,其具有几个重要特性。
- 价值性 :价值,也称为可行性,指的是数据能够被分析以提供有意义信息,从而为组织增加价值的程度。并非所有可捕获的数据都值得捕获,只有那些有可能影响组织行为分析的数据,才应纳入公司的大数据工作中。
- 可视化 :可视化是指以图形方式呈现数据,使决策者能够理解数据含义的能力。大量的数据可能会让决策者淹没在事实中,但却难以理解这些事实的意义。可视化是一种呈现事实的方式,帮助决策者理解信息的含义,从而获得洞察力。
不过,这些特性并非大数据所独有。数据的准确性在任何规模的数据存储中都是一个问题,这也是关系型数据库中数据管理如此重要的原因。数据的价值同样适用于关系型数据库中的传统结构化数据。可视化在数据仓库工作中也是一个重要工具。这些在关系型模型中处理数据时发挥重要作用的特性是通用的,同样适用于大数据。
大数据代表了数据管理挑战的新趋势,但这并不意味着关系型数据库技术会被淘汰。依赖ACID(原子性、一致性、隔离性和持久性)事务的结构化数据,对业务运营始终至关重要。关系型数据库仍然是存储和管理此类数据的最佳方式。但现在,关系型数据库不一定是存储和管理组织所有数据的最佳方式,这导致了多语言持久化的出现,即组织基础设施中多种数据存储和管理技术的共存。
Hadoop技术概述
大数据需要一种专为大规模集群设计的分布式数据存储方法,Hadoop已成为大多数大数据存储和处理的事实上的标准。Hadoop不是数据库,而是一个
超级会员免费看
订阅专栏 解锁全文
3874

被折叠的 条评论
为什么被折叠?



