今天呐就为大家带来一本数据治理相关的书籍,从理论到实践,全面研究剖析。
文末有领取方式哦~
现如今,我们己被数据包围,数据正在逐渐将我们淹没。来自于社交媒体、网络日 志、GP S 信号、RFI D 标签、网 络音频、 数 字图片等方面的数据扑面而来。 大数据被炒得火 热 , 大 数 据 时 代 已 然 来临 。 而 大 数 据 本 身 是 一 个 比 较 抽 象 的 概 念 , 如 果 我 们 仅 仅 从 字 面 来 理解, 它表示数据规模的庞大。但是仅仅数量上的庞大这一简单的理解显得有些狭監, 难 以区分这一概念和以往的 “海量数据” “超大规模数据” 等概念的区别。而现如今,当谈到 大数据定义时都运用比较有代表性的 3V定义,即认为大数据需满足以下了个特点:规模性 ( V o l u m e )、 多 样 性 (V a r i e t y ) 和 高 速 性 (v e l o c i t y ) 。 而 I D C 认 为 还 应 该 添 加 数 据 具 有 的 价 值 性(Value ),1BM 认为大数据必然具有真实性(veracity)。当然每个人对大数据有不同的理 解, 当我们面对实际问题时,没必要拘泥于这些现有的定义,只要符合业务规则即可。 伴随着网络和信息技术的不断发展与普及,人类产生的数据量正在呈指数级增长,在 历史上从未有哪个时代产生如此海量的数据。数据的产生已 经完全不受时间、地点的限制, 大约每两年就会翻 一倍,换句话说,每两年产生的数据量相当于之前产生的全部数据量。 并且根据现有的数据量监测,这个速度还会在很长 一段时间内保持下去。信息数据的单位 由TB 一PB 一EB 一ZB的级别暴增,而这样的数据很明显已经远远超出了我们人力所能处 理的范围,因此大数据应运而生。它的重要性也因此而得之。
伴 随 着 数 据 行 业 的 昌 盛 发 展 , 很 自 然 就 产 生 了 一个 对 应 的 问 题 : 这 些 数 据 作 为 原 材 料 应该怎么管理?虽然数据管理并不新鲜,很早以前我们也 一直在做,但随着数据爆炸性地 呈指数级增长,我们如今所讲的数据和以往已 经大大不同。而这也不仅仅体现在数据的大小上,同时也体现在数据的内容、 来源、结构上。举个简单的例子,现如今Facebook 的日 均新增数据量可达600TB 左右,未来必然会更高。那么处理如此大量的数据,我们不禁要 问:以往的算法还可能吗?应用还能正常运行吗?答案是否定的。随着数据的变化,我们 的 算 法 也 要 升 级, 同 样 , 我 们 以 往 的 数 据 管 理 方 式 与 思 路 也 无 法 完 全 适 应 , 也 需 要 创 新 。 因此大数据治理的概念应运而生。
我认为啊目前最权威的大数据 治理的定义由桑尼尔• 素雷斯日提出,主要包含如下6 个部分:
1 )大数据治理应该被纳 人现有的信息洽理框架内。
2)大数据治理 的工作就是制定策略。
3)大数据必须被优化。
4)大数据的隐私保护很 重要。
5 )大 数 据 必 领被 货 币 化, 即 创 造 商 业 价 值。
6 )大数据治理必领协调好多个职能部门的目标和利益
访问如下地址获得想要的资料,记得关注后回复“sjzlkysj”关键字哦~~
https://acelishe.com/resources?resourceType=2https://acelishe.com/resources?resourceType=2