
大数据
砖家穴者叫兽
这个作者很懒,什么都没留下…
展开
-
一个数据仓库时代开始——Hive
一、什么是 Apache Hive?Apache Hive 是一个基于 Hadoop Haused 构建的开源数据仓库系统,我们使用它来查询和分析存储在 Hadoop 文件中的大型数据集。此外,通过使用 Hive,我们可以在 Hadoop 中处理结构化和半结构化数据。换句话说,Hive 是一个数据仓库基础设施,便于查询和管理驻留在分布式存储系统中的大型数据集。它提供了一种类 SQL 的查询...原创 2019-04-28 20:50:47 · 19008 阅读 · 0 评论 -
数据分析必会的六大实用模型
对于刚刚接触数据分析的人来说,经常会有这样的困惑和疑问:数据分析究竟难不难?难的话难在哪?为什么有时候作分析不知道从何下手,只能眉毛胡子一把抓?其实就连我这种已经在数据分析行业浸淫十几年的老油条,有时候做起分析来也会手忙脚乱,根本原因就在于没有抓住数据分析的本质,我们是为了用大量数据去分析、解释和预测基于数据的事实,你首先要明白自己做数据分析的目的是什么,是为了描述事件分析?还是为了预测?又或...转载 2019-09-03 21:55:29 · 19352 阅读 · 0 评论 -
深入浅出,教你一步步实现数据分析入门、进阶
最近有很多人在问数据分析的一些问题。关于数据分析到底应该怎么学?如何快速入门,以及技术和业务之间的瓶颈如何突破?其实,要学数据分析之前,至少要了解一下数据分析师,到底需要哪些技能。有的同学看到数据分析几个字,就马上开始Python函数+控制语句、R语言和ggplot库……上来一顿骚操作,还没入门就放弃了。这就是需求不明确导致的,当然学习方式也值得商榷,那到底数据分析需要什么样的技能呢? 这...原创 2019-09-23 15:11:14 · 17282 阅读 · 0 评论