🐳 我正在和鲸社区参加“训练营·数据分析业务基础”
和鲸社区 - Heywhale.com,以下是我的学习笔记:
学习主题:数据分析业务基础
日期:2023/9/20
关键概念/知识点:
- 影响数据分析的关键因素:数据指标
- 数据指标搭建的四种模型:OSM模型、AARRR模型、UJM模型、MECE模型
- RFM模型:指Recency、Frequency、Monetary,包含8个用户分类
- 对比分析法:该方法要明确比什么?怎么比?和谁比?
- 多维度拆解法:从业务指标拆解或从业务流程拆解
- 趋势分析法:使用折线图能够直观看出数据走向
- 漏斗分析法/假设检验分析法/留存分析/归因分析/路径分析
- 用户画像分析/结构分析/LTV分析
关键总结:
- KNN算法:采用测量不同特征值之间的距离方法进行分类,即:物以类聚,人以群分。
- 线性回归:回归处理的问题为预测,比如预测房价、销售额的预测、设定贷款额度等等。
- 朴素贝叶斯:一种分类算法。对于给出的待分类项,求解此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。
- 逻辑回归:一种分类模型,对离散变量进行预测。逻辑回归的本质就是预测属于各个分类的概率,有了概率之后,就可以进行分类了。
- K-means算法:是一种聚类分析,聚类分析是无监督类机器学习算法中最常用的一类,目的是将数据划分成有意义或有用的组。
- 决策树和随机森林:决策树是一种有监督学习方法,它能够从一系列有特征和标签的数据中总结出决策规则,并用树状图的结构来呈现这些规则,以解决分类和回归问题。
问题/困惑:
- 不清楚具体的业务场景下具体使用哪一种模型进行分析
- 不清楚如何将机器学习的算法运用到业务场景中去
- 算法实现代码有待理解和练习
下一步计划:
- 完成“机器学习原理与实践训练营”
- 练习各个算法的实现代码
- 完成“数据分析业务基础训练营”中的案例报告
参考资料/相关资源链接:
- 《机器学习》周志华(西瓜书)
- 数据分析业务基础:和鲸社区 - Heywhale.com