- 博客(70)
- 收藏
- 关注
原创 肥胖风险的多类预测——CatBoost模型的89%
评价:效果提升了不少,有0.79左右,接下来我选择使用CatBoost模型(因为是我个人比较喜欢的模型,最终我也是采用了CatBoost模型)评价:效果又提升了不少,准确率突破了0.80,但是无论我后续我怎么调节参数,准确率都在 0.8~0.85 之间,没有得到明显提升。参数调节:也是简单测试几个不同的参数,不进行复杂调参,而且SVM效率很慢(对当前数据集),训练时间长,可以优先考虑其他模型。评价:不需要太复杂的调参,模型效果就得到了很大的提升,准确率提升到了0.892,模型效果很好了。
2025-05-03 21:07:51
717
原创 Python自动化:基于faker批量生成模拟数据(以电商行业销售数据为例)
“造数据”是一个数据分析师的基本技能,“造数据”不是说胡编乱造,而是根据自己的需求去构造一些模拟数据集,用于测试等用途,而且使用虚拟数据不用担心数据隐私和安全问题。
2025-01-19 20:20:43
1413
原创 数据分析思维(十一):应用篇——用数据分析解决问题
数据分析并非只是简单的数据分析工具三板斧——Excel、SQL、Python,更重要的是数据分析思维。没有数据分析思维和业务知识,就算拿到一堆数据,也不知道如何下手。
2025-01-12 22:24:22
1885
1
原创 数据分析思维(十):分析方法——漏斗分析方法
数据分析并非只是简单的数据分析工具三板斧——Excel、SQL、Python,更重要的是数据分析思维。没有数据分析思维和业务知识,就算拿到一堆数据,也不知道如何下手。
2025-01-09 19:06:42
1374
原创 数据分析思维(九):分析方法——AARRR模型分析方法
数据分析并非只是简单的数据分析工具三板斧——Excel、SQL、Python,更重要的是数据分析思维。没有数据分析思维和业务知识,就算拿到一堆数据,也不知道如何下手。
2025-01-08 23:58:41
1502
原创 数据分析思维(八):分析方法——RFM分析方法
数据分析并非只是简单的数据分析工具三板斧——Excel、SQL、Python,更重要的是数据分析思维。没有数据分析思维和业务知识,就算拿到一堆数据,也不知道如何下手。
2025-01-05 21:00:45
1597
原创 数据分析思维(七):分析方法——群组分析方法
数据分析并非只是简单的数据分析工具三板斧——Excel、SQL、Python,更重要的是数据分析思维。没有数据分析思维和业务知识,就算拿到一堆数据,也不知道如何下手。
2025-01-02 11:51:19
1531
1
原创 数据分析思维(六):分析方法——相关分析方法
数据分析并非只是简单的数据分析工具三板斧——Excel、SQL、Python,更重要的是数据分析思维。没有数据分析思维和业务知识,就算拿到一堆数据,也不知道如何下手。
2024-12-30 20:17:36
1339
原创 数据分析思维(五):分析方法——假设检验分析方法
数据分析并非只是简单的数据分析工具三板斧——Excel、SQL、Python,更重要的是数据分析思维。没有数据分析思维和业务知识,就算拿到一堆数据,也不知道如何下手。
2024-12-23 23:48:17
1713
原创 数据分析思维(四):分析方法——对比分析方法、A/B测试
数据分析并非只是简单的数据分析工具三板斧——Excel、SQL、Python,更重要的是数据分析思维。没有数据分析思维和业务知识,就算拿到一堆数据,也不知道如何下手。
2024-12-20 20:09:56
1582
原创 数据分析思维(三):分析方法——多维度拆解分析方法
数据分析并非只是简单的数据分析工具三板斧——Excel、SQL、Python,更重要的是数据分析思维。没有数据分析思维和业务知识,就算拿到一堆数据,也不知道如何下手。
2024-12-17 21:34:11
1716
原创 数据分析思维(二):分析方法——5W2H分析方法、逻辑树分析方法、行业分析方法
数据分析并非只是简单的数据分析工具三板斧——Excel、SQL、Python,更重要的是数据分析思维。没有数据分析思维和业务知识,就算拿到一堆数据,也不知道如何下手。
2024-12-14 16:40:11
1341
原创 数据分析思维(一):业务指标(数据分析并非只是简单三板斧)
数据分析并非只是简单的数据分析工具三板斧——Excel、SQL、Python,更重要的是数据分析思维。没有数据分析思维和业务知识,就算拿到一堆数据,也不知道如何下手。
2024-12-11 20:44:58
1734
原创 假设检验:单/双变量假设检验
原假设(H)与备择假设(H)显著性水平(α):常用值:0.05(5%)或 0.01(1%)。统计量第一类错误和第二类错误:第一类错误 (α):当 H0 为真时,错误地拒绝 H0。第二类错误 (β):当 H0 为假时,错误地接受 H0。权衡:降低 α 会增加 β,需要根据问题的重要性平衡两类错误。提出假设:建立两个互斥的假设,即原假设 H0 和备择假设 H1。选择检验方法(如 t-检验、卡方检验)。设定显著性水平:通常取 α=0.05 或 α=0.01。
2024-12-08 22:09:33
1809
原创 数据分析实战项目:基于K-means的客户细分(集群分析)
根据上述探索性分析,模型能从多个不同方面很好的展现群体之间的差异,说明模型效果良好。
2024-12-05 22:11:23
1920
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人