- 博客(7)
- 收藏
- 关注
原创 用python实现,比较两种数据的密度分布图
这两个库提供了绘制密度分布图(Kernel Density Estimate, KDE)的功能。运行这段代码后,你会在密度分布图上看到每个数据集的平均值和中位数标记的垂直线,帮助你更好地理解数据的集中趋势。你可以在密度分布图上添加平均值和中位数的垂直线来对比这两个数据集的集中趋势。使用Python中的。
2024-09-13 09:04:24
896
原创 实例演示如何分析顾客流失率(Customer Churn Rate)
这个实例展示了如何构建一个简单的顾客流失预测模型。通过使用逻辑回归模型,我们可以根据客户的历史行为和特征预测哪些客户可能会流失,并采取相应的措施来减少流失。你可以尝试使用更复杂的模型(如随机森林或XGBoost)来进一步提高预测准确性。
2024-08-29 09:55:02
1708
原创 实例讲解什么是A/B test以及如何操作分析
AB测试的基本原理是通过将用户随机分配到不同的测试组(如A组和B组),然后对比不同方案的效果,选择最优方案。假设我们有一个电商网站,正在测试两种不同的促销页面设计(版本A和版本B),并希望确定哪个版本能带来更高的转化率。例如,在电商平台上,目标可能是提升某一商品的购买转化率或增加点击率。监测一定时间内的用户行为数据,重点关注转化率(即点击“立即购买”按钮的用户比例)。优化网站主页的设计,以提高用户点击“立即购买”按钮的转化率。将“立即购买”按钮改为红色,并增大按钮的尺寸可以提高转化率。
2024-08-22 18:23:21
1058
原创 两个店铺组中进行价格测试时的统计学分析
配对t检验(Paired t-test): 用于比较同一组内价格测试前后销售的变化。两因素方差分析(ANOVA): 用于比较两个组之间测试前后销售变化的差异(交互效应)。
2024-08-19 17:57:06
585
原创 什么是 LightGBM 学习笔记
LightGBM 是基于决策树的提升算法。它通过不断迭代,逐步构建多个弱学习器(如决策树),并将它们结合起来形成一个强大的模型。速度快:利用直方图算法和高效的分裂方法,大大加快了训练过程。内存占用少:使用更少的内存来处理大规模数据集。处理大规模数据:对大量特征、样本进行高效处理。支持类别特征:可以直接处理类别型数据,而无需进行独热编码(One-Hot Encoding)。
2024-08-19 14:42:45
674
原创 Python 编写自动发送每日电子邮件报告的脚本
这些库都是 Python 标准库的一部分,因此不需要额外安装。如果需要处理 HTML 报告或附件,可能还需要。根据您的电子邮件提供商配置 SMTP 服务器信息。库每天在指定时间(例如上午8点)运行。函数,确保所有配置和代码都正常工作。首先,您需要安装用于发送电子邮件的。在正式运行前,最好先手动运行一次。您可以根据需要调整时间。库,这也是标准库的一部分。库以及处理邮件内容的。
2024-08-19 10:43:02
649
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅