大数据
文章平均质量分 78
小术晓术
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
大数据预处理方法,来看看你知道几个
大数据蕴含巨大价值,引起了社会各界的高度关注。大数据的来源多种多样,从现实世界中采集的数据大体上都是不完整、不一致的脏数据,无法直接进行数据挖掘和分析,或分析挖掘的结果差强人意。为了提高数据分析挖掘的质量,需要对数据进行预处理。 数据预处理方法主要包括数据清洗、数据集成、数据转换和数据消减。 1 .数据清洗 现实世界的数据常常是不完全的、含噪声的、不一致的。数据清洗过程包括缺失数据处理、噪声数据处理,以及不一致数据处理。 对于缺失的数据,可以采用忽略该条记录、手动补充缺失值、利用默认值填补缺失值、利用均值填原创 2021-11-11 10:31:45 · 8708 阅读 · 0 评论 -
吐血整理:常用的大数据采集工具,你不可不知
大数据的来源多种多样,在大数据时代背景下,如何从大数据中采集出有用的信息是大数据发展的最关键因素。大数据采集是大数据产业的基石,大数据采集阶段的工作是大数据的核心技术之一。为了高效采集大数据,依据采集环境及数据类型选择适当的大数据采集方法及平台至关重要。下面介绍一些常用的大数据采集平台和工具。 1 Flume Flume作为Hadoop的组件,是由Cloudera专门研发的分布式日志收集系统。尤其近几年随着Flume的不断完善,用户在开发过程中使用的便利性得到很大的改善,Flume现已成为Apache To原创 2021-11-11 10:17:12 · 1519 阅读 · 0 评论 -
这本少见的大数据采集与处理书,到底讲了啥?
计算技术的进步,以及移动互联网、物联网、5G移动通信技术的发展,引发了数据规模的爆发式增长。大数据蕴含巨大价值,引起了社会各界的高度关注。大约从2009年开始,“大数据”成为互联网信息技术行业的流行词汇。在经历了几年的批判、质疑、讨论、炒作之后,大数据终于迎来了属于它的时代。 大数据时代将在众多领域中掀起变革的巨浪。在以云计算为代表的技术创新大幕的衬托下,这些原本很难收集和使用的数据开始容易被利用起来了,通过各行各业的不断创新,大数据会逐步为人类创造更多的价值。大数据的能量是不可估量的,比如在2020年,大原创 2021-10-27 15:48:27 · 1032 阅读 · 0 评论
分享