
数据分析
J0han
学无止境,虚心求知。
展开
-
数据分析学习笔记
目录一.介绍二.代码实现一.介绍集中趋势:均值,中位数,众数,分位数(常用四分位数) 离中趋势:标准差,方差数据分布:偏态与峰度 S为+:正偏 均值大 为负则反之 ...原创 2018-08-31 20:02:15 · 784 阅读 · 1 评论 -
数据分类
目录定类(类别)数据定序(顺序)数据定距(间隔)数据定比(比率)数据定类(类别)数据:定义:根据事物离散、无差别属性进行的分类。例子:比如说性别,民族,我们在统计数据时,不能说一个男生和女生之间有高低大小之分定序(顺序)数据:定义:可以界定数据的大小,但不能测定差值例子:比如说收入的低中高,高等收入比中等收入高,中等收入比低等收入高,但是无法确定具体的差值...原创 2018-09-01 14:52:24 · 2413 阅读 · 0 评论 -
数据分析之异常值分析
异常值分析又分连续异常值,离散异常值,和知识异常值。一.连续异常值 Q3,Q2,Q1分别为上四分位数,中位数和下四分位数如图上下界之间的为正常值,那么上下界以外的就是异常值了,由此可见,异常值的测定程度由K决定。通常当K=1.5,就算是中等异常;K=3时,就算是非常的异常。由于异常值的出现,它让大部分本可以代表数据属性的值失去意义二.离散异常值 离散属性定义...原创 2018-09-02 08:08:19 · 3827 阅读 · 0 评论 -
数据分析之对比分析
目录比什么?绝对数和相对数1.绝对数比较2.相对数比较怎么比? 时间维度 空间维度: 经验与计划的比较比什么?绝对数和相对数1.绝对数比较比较直接的数字2.相对数比较 结构相对数 部分与整体。产品合格率-产品质量 比例相对数 总体内不同部分的数值 比较相对数 ...原创 2018-09-02 08:13:27 · 1832 阅读 · 0 评论 -
关于sklearn中train_test_split
sklearn.model_selection.train_test_split(*arrays, **options) 作用:将数组或矩阵拆分为随机序列和测试子集 我们先了解其参数和返回值,然后通过例子来学会使用它。参数:arrays :具有相同长度/形状的可索引序列,允许的输入是列表,numpy数组,scipy-sparse矩阵或pandas数据帧。test_size : fl...原创 2018-09-12 20:31:37 · 3296 阅读 · 0 评论