
数据挖掘学习系列
J-JunLiang
一个热爱挖掘的数据从业者,勤学好问、动手达人,公仔厂的一位码农,期待与大家一起交流探讨机器学习相关内容~
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数据挖掘之统计学基础(1):【理论】描述性统计
0x00前言 描述性统计是一种汇总统计,用于定量描述或总结信息集合的特征。描述性统计的对象既可以是总体,也可以总体的一部分即是样本。 描述性统计分为集中趋势和离散趋势。 0x01集中趋势 集中趋势又称 “数据的中心位置”,集中趋势反映了数据向其中心值聚集的程度,是对数据一般水平的概括性度量,主要通过平均值、中位数和众数来表示。 1.众数 出现频次最高的观测值。 例子:数据集[...原创 2019-07-17 12:39:14 · 4369 阅读 · 0 评论 -
数据挖掘之统计学基础(2):【实践】描述性统计
0x01 Python环境安装 1.下载miniconda(Linux版) 下载地址:https://docs.conda.io/en/latest/miniconda.html 2.安装miniconda ./Miniconda3-latest-Linux-x86_64.sh 3.创建python3环境 conda create -n py36 python=3.6 source activat...原创 2019-07-24 19:44:26 · 836 阅读 · 0 评论 -
数据挖掘之统计学基础(3):【理论】概率分布
数据挖掘之统计学基础(3):【理论】概率分布 0x00前言 概率分布(probabilitydistribution)或简称分布(distribution),是概率论的一个概念。 具有相同分布函数的随机变量一定是同分布的,因此可以用分布函数来描述一个分布,但更常用的描述手段是概率密度函数(probability density function,pdf)。 0x01基本概念 1.随机变量 随机变量...原创 2019-08-02 20:26:28 · 1385 阅读 · 0 评论 -
数据挖掘之统计学基础(4):【实践】数据分布-Python实战
import numpy as np import pandas as pd import time import matplotlib as mpl import matplotlib.pyplot as plt %matplotlib inline plt.style.use('ggplot') plt.rcParams['figure.figsize'] = (18.0, 10.0) ...原创 2019-08-13 20:44:22 · 931 阅读 · 0 评论