
数据分析
dancy_hou
这个作者很懒,什么都没留下…
展开
-
泰坦尼克号生存预测分析
泰坦尼克号生存预测分析获取数据数据简单描述性分析数据可视化深入了解数据获救情况人数可视化乘客等级分布可视化...各等级的乘客年龄分布数据预处理数据缺失值处理数据one_hot处理数据标准化处理建立模型,训练模型获取数据数据简单描述性分析根据数据信息可知,训练数据总共有891名乘客,但是有些属性的数据不全。(Age–714条记录,Cabin–只有204名乘客已知)—>需要深入了解数据...原创 2019-03-09 13:58:34 · 1219 阅读 · 0 评论 -
9种数据分析方法
数据分析方法细分分析对比分析漏斗分析同期群分析聚类分析埋点分析来源分析用户分析(运营核心)表单分析细分分析方法:逐步分析,维度交叉模型:漏斗转化对比分析方法:时间对比,空间对比,标准对比漏斗分析转化漏斗分析是业务分析的基本模型解决问题: 是否存在泄露点,是否存在不应该出现的过程同期群分析直接描述用户在一段时间周期的留存或流失变化情况聚类分析聚类分析最具有简单,直观的特征聚...原创 2019-03-09 14:29:36 · 514 阅读 · 0 评论 -
统计学习方法概论之思维导图图解
原创 2019-03-10 11:08:06 · 1137 阅读 · 0 评论 -
机器学习概述
机器学习概述1.什么是机器学习?2.为什么需要机器学习?3.机器学习的种类有监督学习、无监督学习、半监督学习和强化学习批量学习和在线学习基于实例的学习和基于模型的学习4.机器学习的一般流程1.什么是机器学习?人工智能:通过人工的方法,模拟某些人类的智能行为。机器学习:通过人工的方法,模拟某些人类的学习行为,自适应,自完善,自发展系统。定义:一个计算机程序在完成任务T之后,获得经验E,其表现...原创 2019-08-03 17:05:27 · 343 阅读 · 0 评论 -
数据预处理
数据预处理1.数据清洗删除筛选处理2.数据集成3.数据变换4.数据规约1.数据清洗主要删除原始数据集中的无关数据、重复数据,平滑噪声数据,筛选掉与挖掘主题无关的数据,处理缺失值、异常值。删除无关数据 重复数据筛选筛选掉与挖掘主题无关的数据处理对象:缺失值 异常值缺失值处理方法删除记录(如删除小部分,可达到目标最有效)数据插补插值的数选择均:值/中位数/众数,固定值,最...原创 2019-08-03 18:12:21 · 532 阅读 · 0 评论 -
数据挖掘技术基本任务
数据挖掘技术基本任务1.分类与预测删除筛选处理2.聚类分析3.关联规则4.时序模式4.偏差检测5.智能推荐1.分类与预测定义分类:构造一个分类模型,输入样本的属性值,输出对应的类别,将每个样本映射到预先定义好的类别,分类模型建立在已有类标记的数据集上。预测:建立两种或两种以上变量间相互依赖的函数模型,然后进行预测或控制。两步过程:通过训练集建立预测属性(数值型的)的函数模型;在模型通过...原创 2019-08-03 20:10:54 · 3495 阅读 · 0 评论 -
数据分析方法部分总结
数据分析方法部分总结描述统计假设检验信度分析列联表分析相关分析方差分析回归分析聚类分析判别分析主成分分析因子分析时间序列分析生存分析典型相关分析ROC分析其他分析描述统计缺失值填充常用方法:剔除法均值法最小邻居法比率回归法决策树法正态性检验常用方法:非参数检验的K-量检验P-P图Q-Q图W检验动差法假设检验参数检验U检验T检验a. 单样本T检验(总体...原创 2019-08-03 20:53:30 · 854 阅读 · 0 评论