立即学习:https://edu.youkuaiyun.com/course/play/6861/326736?utm_source=blogtoedu
ROI 投资回报率
ROI >1 赚钱
SEMMA--数据分析流程
S:Sample(搜集数据)
问卷调查
数据库查询
实验室试验
仪器设备的记录
E:Explore(数据探索)如何预测收入范围/影响收入的因素有哪些
离散变量的分布比例(例如性别)
连续变量的分布形态
数据的异常和缺失
特征选择
M:Modify(数据修正)常用的数据修正方法
数据类型的转换
数据的一致性处理
异常值和缺失值的处理
数据形态的转换
M:Model(数据建模)
侧重于未知事件的预测
1.有监督的预测性模型(回归、决策树、knn)
2.有监督的判别性模型
3.无监督模型
4.半监督模型
基于调查数据,预测用户的收入水平
A:ASSESS (模型评估)
RMSE
混淆矩阵
ROC曲线
KS曲线
怎么做好模型
1.增加样本
2.扩展维度
3.修正模型参数
4.更换其他模型
本文详细介绍了SEMMA数据分析流程,包括Sample(搜集数据)、Explore(数据探索)、Modify(数据修正)、Model(数据建模)和Assess(模型评估)。探讨了如何通过增加样本、扩展维度、修正模型参数和更换模型来提升模型效果。
1204

被折叠的 条评论
为什么被折叠?



