大数据的概念

大数据是指数据量巨大、增长快速、类型多样,超出传统数据库处理能力的数据集合。其特征包括Volume(数据量)、Variety(多样性)、Velocity(速度)和Value(价值密度)。大数据的工作流程涵盖数据源、采集、存储、清洗、分析到展示。大数据与云计算、物联网相辅相成,大数据提供价值,云计算提供处理能力,物联网则产生大量数据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

大数据的定义:

维基百科 给出的定义: 
	数据规模巨大到无法通过人工在合理的时间内达到截取,管理,处理并整理成为人类所解读的信 
息。

麦肯锡全球研究所 给出的定义:
	一种规模大到在获取、存储、管理、分析方面都大大超出了传统数据库软件工具能力范围的数据 集合。

高德纳(Gartner)研究机构 给出的定义:
	"大数据"是需要新的处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、 高增长率和多样化的信息资产。

概念总结:
	海量数据,具有高增长率、数据类型多样化、一定时间内无法使用常规软件工具进行捕捉、管理 和处理的数据集合。

大数据的特征:

1. Volume:巨大的数据量 
2. Variety:数据类型多样化 	
		--(1):结构化的数据 
			即有固定格式和有限长度的数据。 
		--(2):半结构化的数据 
			是一些XML或者HTML的格式的数据。 
		--(3):非结构化的数据 
			现在非结构化的数据越来越多,就是不定长、无固定格式的数据,例如网页、语音,视频等。 
3. Velocity: 数据增长速度快 
4. Value:价值密度低 

大数据的一般工作流程

1.数据源
2.数据采集或者同步
3.数据存储
4.数据清洗
5.数据分析
6.数据展示

大数据与云计算、物联网

之间的区别:
- 大数据侧重于对海量数据的存储、处理与分析,从海量数据中发现价值,服务于生产和生活;
- 云计算本质上旨在整合和优化各种IT资源并通过网络以服务的方式,廉价地提供给用户;
- 物联网的发展目标是实现物物相连,应用创新是物联网发展的核心。

之间的联系:
- 从整体上看,大数据、云计算和物联网这三者是相辅相成的。
物联网的传感器源源不断产生的大量数据,构成了大数据的重要数据来源,没有物联网的飞速发展,就不会带来数据产生方式的变革,即由人工产生阶段转向自动产生阶段,大数据时代也不会这么快就到来。同时,物联网需要借助于云计算和大数据技术,实现物联网大数据的存储、分析和处理。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值