大数据技术全解析:从基础概念到前沿应用
1. 大数据时代的来临
在计算机科学领域,数据被视为主要的原材料。它通过将现实世界抽象为类别、度量和其他表现形式(如字符、数字、关系、声音、图像、电子波)而产生,这些形式构成了创造信息和知识的基石。随着互联网技术的广泛普及,数据的生成和消费已成为人们日常生活的一部分。我们正逐步迈向一个数据驱动的社会,数据成为了最有价值的资产之一。
大数据通常具有三个显著特性,即 3V 特性:
- Volume(大量) :数据量巨大,可达数 TB 甚至 PB 级别。
- Velocity(高速) :数据几乎实时生成。
- Variety(多样) :数据形式多样,包括结构化和非结构化数据。
近年来,研究界、企业和政府部门都意识到了大数据分析的巨大潜力,该领域不断取得进展。
2. 大数据相关主题概述
大数据技术涵盖了众多相关方面、主题和技术,以下是一些主要的主题分类:
|主题分类|主要内容|
| ---- | ---- |
|大数据集成|数据清洗、数据融合、数据集成、数据湖、数据探查、数据整理、ETL、整体模式匹配、面向集成的本体、大规模实体解析、大规模模式匹配、隐私保护记录链接、概率数据集成、记录链接、模式映射、真相发现、不确定模式匹配|
|Big SQL|大数据索引、Hadoop 上 SQL 的缓存、基于云的大数据 SQL 解决方案、列式存储格式、Hive、基于传统数据库扩展的混合系统、Impala、Hadoop 上 SQL 的查询优
超级会员免费看
订阅专栏 解锁全文
1334

被折叠的 条评论
为什么被折叠?



