只要提到和计算机有关的名词或者其他,那么一定绕不开大数据这个词,那么到底什么才是大数据?它有什么价值和影响?
首先,就是数据量大。看名字,一个大字就能说明在大数据时代和科技不断发展的今天,数据量的增加不可忽视,这里借鉴一个定律即大数据摩尔定律。这是一个国际机构提出的预测,他的预测是数据每年都在以50%速度在增长,这意味着每两年数据量就会增长一倍。而且最近两年产生的数据量之和相当于我们人类发展历史上所有的数据量之和。发展到2020年时候,我们数据量大概拥有35ZB。ZB量级是一个什么概念呢?一千GB,是一个T;一千T,是一个P;一般到了到了一千P以上,就可能都不太了解了,一千PB就是一个EB,一千Eb上面才是ZB,远远超出我们想象空间了。
其次就是数据的多样化,既然是大数据时代,那么肯定包括了想到想不到的各种数据,不过大致可以分成是结构化和非结构化,结构化数据,顾名思义,就是数据库中很规整的数据,但是往往这类数据在整个大数据中占比不到10%,那么剩余的一定就是非结构化数据。非结构化数据,就是一些不那么规整的数据,像是科学研究、企业应用、web里面的文本、图像、视频等。
再次就是大数据的另一个特征: 迅速化,同样字面意思理解,就是处理数据十分的迅速,不能再像原来那样,处理数据需要一步一步的慢慢来,就拿淘宝举例子,如果数据的处理缓慢,一个人提交订单就得处理半天,那么双十一那天就不可能达到那么庞大的成交额。
抛开淘宝不谈,任何企业的决策也不是需要很长的时间,有时候也是需要激素的处理数据并作出决策的。这就说明大数据时代,光有庞大的数据库和量级数据还远远不够,能够快速的反应和处理数据才是大数据时代正确的使用方式。
还有一个应该是大家都能感同身受的,那就是这些数据不是每个数据都是有价值的,像是每个都都会收到的垃圾短信一样,那些也是要作为数据储存在某个数据库中的,但是确实没什么营养和使用价值的数据,再比如像是铺天盖地的监控摄像头,他基本上是每秒钟都在产生视频,也就意味着无时无刻不在产生数据,但