
数据挖掘学习系列
J-JunLiang
一个热爱挖掘的数据从业者,勤学好问、动手达人,公仔厂的一位码农,期待与大家一起交流探讨机器学习相关内容~
展开
-
数据挖掘之统计学基础(1):【理论】描述性统计
0x00前言描述性统计是一种汇总统计,用于定量描述或总结信息集合的特征。描述性统计的对象既可以是总体,也可以总体的一部分即是样本。描述性统计分为集中趋势和离散趋势。0x01集中趋势集中趋势又称 “数据的中心位置”,集中趋势反映了数据向其中心值聚集的程度,是对数据一般水平的概括性度量,主要通过平均值、中位数和众数来表示。1.众数出现频次最高的观测值。例子:数据集[...原创 2019-07-17 12:39:14 · 4326 阅读 · 0 评论 -
数据挖掘之统计学基础(2):【实践】描述性统计
0x01 Python环境安装1.下载miniconda(Linux版)下载地址:https://docs.conda.io/en/latest/miniconda.html2.安装miniconda./Miniconda3-latest-Linux-x86_64.sh3.创建python3环境conda create -n py36 python=3.6source activat...原创 2019-07-24 19:44:26 · 823 阅读 · 0 评论 -
数据挖掘之统计学基础(3):【理论】概率分布
数据挖掘之统计学基础(3):【理论】概率分布0x00前言概率分布(probabilitydistribution)或简称分布(distribution),是概率论的一个概念。具有相同分布函数的随机变量一定是同分布的,因此可以用分布函数来描述一个分布,但更常用的描述手段是概率密度函数(probability density function,pdf)。0x01基本概念1.随机变量随机变量...原创 2019-08-02 20:26:28 · 1354 阅读 · 0 评论 -
数据挖掘之统计学基础(4):【实践】数据分布-Python实战
import numpy as npimport pandas as pdimport timeimport matplotlib as mplimport matplotlib.pyplot as plt%matplotlib inlineplt.style.use('ggplot')plt.rcParams['figure.figsize'] = (18.0, 10.0)...原创 2019-08-13 20:44:22 · 903 阅读 · 0 评论