大数据综述

大数据已从理论走向产业化,对国家安全、各行业产生深远影响。IDC定义大数据为大体量、多样化、快速处理的数据,具有3V特征:Volume(海量化)、Variety(多样化)、Velocity(快速化)。麦肯锡提出五种大数据利用方法,包括透明化数据、启用实验、细分市场、机器辅助决策和创新业务。通信领域中,运营商如联通、移动、电信正加速推进大数据应用,华为等设备公司也在加大研究力度。大数据时代要求我们接受更多、更杂、更好的思维变革。

作者按:本文写就于2014年初,一晃3年已过。大数据已经从最初的理论研究,逐渐产业化,并已服务于各行各业。

“棱镜门”事件的持续发酵,深刻揭露出科技领先大国利用信息技术的优势,有计划、有步骤地采集各国的“数字DNA”。由此可见,数据本身的重要性,已经超过了传统的信息产业、工业产业,逐步在国家安全等更高领域得以体现。
根据国外机构的测算,全世界数据总量以每两年翻一翻的速度递增,最近两年产生的数据总量,相当于人类有史以来所有数据量的总和。在这个大背景下,各个行业,无论是传统的工业行业,还是现在的互联网公司,已经意识到数据的独特价值并积极利用。
大数据(Big Data)的概念应运而生。它已成为继互联网、云计算、物联网后,又一个被市场争相传诵的热门科技概念。
究竟什么是大数据呢?
国际数据公司(IDC)在它的报告中给出了一个定义:大数据技术是新一代的技术与架构,它被设计用于在成本可承受(economically)的条件下,通过非常快速(velocity)的采集、发现和分析,从大体量(volumes)、多类别(variety)的数据中提取价值(value)。
IDC的定义描述了大数据的三大特征,也即俗称的3V(Volumes,Velocity,Variety)。3V是对大数据最基本特征的归纳,得到大家的共识。虽然后续不断有人增加对V的理解,如Value(价值),强调大数据中的总体价值大,但是价值密度低;如Veracity(真实和准确),强调真实而准确的数据才能让对数据的管控和治理真正有意义;如有Vitality(动态性)强调数据体系的动态性等。这些都有一定的理解,但都不及开始的3V具有广泛性。
1、海量化Volumes
大数据首先是数据体量大。全球数据量正以前所未有的速度增长,遍布世界各个角落的传感器、移动设备、在线交易和社交网络每天都要生成上百万兆字节的数据。据估计,全球可统计的数据存储量在2011年约 为1.8ZB,2012年将达到2.7ZB,2015年将超过8ZB。数据容量增长的速度大大超过了硬件技术的发展速度,以至于引发了数据存储和处理的危机。
2、多样化Variety
大数据的数据类型非常多。原来的数据都可以用二维表结构存储在数据库中,称之为结构化数据。

### 关于大数据综述性文章 #### 数据特征与技术概述 大数据具有四个主要特点:Variety(多样的数据类型)、Velocity(快速的数据流转)、Value(发现数据价值)以及Volume(海量数据规模)。这些特性决定了处理大数据所需的技术栈与其他传统数据处理方式存在显著差异[^1]。 #### 技术发展背景 随着信息技术(IT)向数据技术(DT)转变,数据量呈现爆炸式增长。这一变化不仅带来了前所未有的机遇也提出了新的挑战——即如何有效地管理和利用如此庞大的信息资源。为了应对这个难题,各类先进的技术和工具应运而生,其中包括但不限于Hadoop生态系统中的MapReduce框架等[^2]。 #### MapReduce的作用 作为一种编程模型及其相应的实现算法,MapReduce旨在简化大规模分布式计算任务的设计与执行过程。通过将复杂的运算分解成多个简单的映射(map)操作和规约(reduce)阶段,使得即使是没有深厚并行编程经验的研发人员也能轻松构建高效能的大数据分析应用程序[^3]。 对于希望深入了解上述主题以及其他相关概念和技术细节的人来说,在优快云博客平台上可以找到许多高质量的文章供学习交流之用。例如: - **《深入理解大数据》系列**:该系列由多位行业专家联合撰写而成,涵盖了从理论基础到实际应用各个方面的内容; - **《玩转Hadoop生态圈》专栏**:专注于介绍围绕Apache Hadoop所建立起来的一整套开源软件集合体,包括但不限于YARN、Spark、Flink等多个子项目; - **《企业级数据仓库建设指南》专题报道**:探讨了现代商业环境中实施有效率的数据管理策略的重要性,并分享了一些成功案例研究。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值