大数据


大数据作为时下最火热的IT行业的词汇之一,我们几乎每天都能听到或者谈及,甚至正在应用,那么究竟什么是大数据呢。通常大数据具有4V的特征:

Volume:大量的海量的数据;

Variety:多样性,结构化、半结构化、非结构化数据;

结构化数据(即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据)
非结构化数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等
所谓半结构化数据,就是介于完全结构化数据(如关系型数据库、面向对象数据库中的数据)和完全无结构的数据(如声音、图像文件等)之间的数据,HTML文档就属于半结构化数据。它一般是自描述的,数据的结构和内容混在一起,没有明显的区分。 

Velocity: 速度性,例如传感器源源不断产生的数据,这类数据通常具有时效性;

Veracity:但真实性是数据分析的基础;

hadoop:是一个能够对大量数据进行分布式处理的软件框架

  流计算

数据仓库(传统)

刚刚接触大数据,还处于概念阶段,写此文做记录。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值