结构化,半结构化,非结构化数据

本文详细解释了结构化数据、半结构化数据及非结构化数据的概念,并对比了它们的特点与应用场景。结构化数据易于管理和检索,适合传统的关系型数据库;半结构化数据介于两者之间,具有一定的灵活性;而非结构化数据则更为复杂多样,如文本、图片和视频等。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

概念
结构化数据:即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据。
半结构化数据:介于完全结构化数据(如关系型数据库、面向对象数据库中的数据)和完全无结构的数据(如声音、图像文件等)之间的数据,HTML文档就属于半结构化数据。它一般是自描述的,数据的结构和内容混在一起,没有明显的区分。
非结构化数据:不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等。

数据模型
结构化数据:二维表(关系型)
非结构化数据:树、图
非结构化数据:无

其他
结构化数据:先有结构、再有数据
半结构化数据:先有数据,再有结构

出处:http://blog.youkuaiyun.com/haiross/article/details/21025813
相对于结构化数据(即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据)而言,不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等。
字段可根据需要扩充,即字段数目不定,可称为半结构化数据,例如Exchange存储的数据。
非结构化数据库

在信息社会,信息可以划分为两大类。一类信息能够用数据或统一的结构加以表示,我们称之为结构化数据,如数字、符号;而另一类信息无法用数字或统一的结构表示,如文本、图像、声音、网页等,我们称之为非结构化数据。结构化数据属于非结构化数据,是非结构化数据的特例

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值