
大数据学习基础
夏洛克江户川
不会打篮球的码农不是好老板
展开
-
统计学在业内的应用1:分布、参数估计与假设检验及工业界应用
统计学在业内的应用1:分布、参数估计与假设检验及工业界应用统计学的方法应用框架1、统计学的学科逻辑2、分布2.1 何为分布2.2 概率分布函数(通常直接简称为分布函数)一、离散情况二、连续情况2.3、总体分布、样本分布、抽样分布一、总体、样本、抽样分布二、大数定律三、中心极限定理2.4、常见分布3、参数估计3.1、点估计3.2、区间估计4、假设检验4.1、显著性水平与p值的含义4.2、第一类错误与...原创 2020-03-06 15:20:14 · 5056 阅读 · 4 评论 -
标准化和归一化,请勿混为一谈,透彻理解数据变换
标准化与归一化1、标准化(Standardization)和归一化(Normalization)概念1.1、定义1.2、联系和差异一、联系二、差异1.3、标准化和归一化的多种方式2、标准化、归一化的原因、用途3、什么时候Standardization,什么时候Normalization4、所有情况都应当Standardization或Normalization么5、一些其他的数据变换方式5.1、l...原创 2019-10-21 23:45:13 · 80317 阅读 · 19 评论 -
大数据学习环境配置——windows和macOS下的python+mysql+hadoop+spark配置
随着大数据的热度与市场需求不断提升,学习大数据的小伙伴越来越多,然而,大家的个人电脑平时可能都用做了打游戏,看剧,逛论坛,没有配置过一套适合于学习大数据的环境,于是乎感叹万事开头难,今天,就带大家打开大数据世界的大门,带领大家在自己的电脑下配置Hadoop+Spark+Mysql,当然,还有Python3+Jupyter Notebook的开发环境。原创 2018-04-30 11:13:41 · 2187 阅读 · 2 评论