大数据:从基础到架构的全面解析
大数据发展背景与应用场景
技术的变革并非孤立发生,当重要需求出现,且技术的可用性和成熟度能够满足这些需求时,变革就会应运而生。大数据核心的许多技术,如虚拟化、并行处理、分布式文件系统和内存数据库等,已经存在了数十年。高级分析技术同样历史悠久,尽管并非一直都具有实用性。而像 Hadoop 和 MapReduce 等技术,仅仅在近几年才崭露头角。这些技术进步的组合如今能够解决重大的业务问题。企业希望能够以合适的速度从各种不同类型的数据中获取洞察和可操作的结果,无论涉及的数据量有多大。
如果企业能够以可接受的性能分析 PB 级的数据(相当于 2000 万个装满文本文件的四抽屉文件柜,或 13.3 年的高清电视内容),以识别模式和异常,那么企业就能够以新的方式理解数据。向大数据的转变不仅仅关乎企业,科学、研究和政府活动也推动了其发展。例如,分析人类基因组,处理天文台收集的所有天文数据以增进我们对周围世界的理解,以及政府在反恐活动中收集的大量数据,这些都表明大数据不仅仅是商业领域的事情。
根据数据是动态数据还是静态数据,存在不同的处理方法。以下是两个简单的例子:如果一家公司能够在制造过程中分析其产品质量,以避免代价高昂的错误,那么就会使用动态数据;而业务分析师则会使用静态数据,基于客户关系的各个方面,包括销售、社交媒体数据和客户服务交互,来更好地了解客户当前的购买模式。
需要注意的是,我们仍处于利用海量数据全面了解业务、预测客户期望变化的早期阶段。获取业务所需答案的各项技术之间仍然相互孤立。为了实现理想的最终状态,三波技术必须融合在一起。大数据并非仅仅涉及一种工具或一项技术,而是关乎所有这些技术如何结合,基于正确的数据,在正确的时间提供正
超级会员免费看
订阅专栏 解锁全文
993

被折叠的 条评论
为什么被折叠?



