- 博客(23)
- 收藏
- 关注
原创 2025.12.24 python总结
pd.qcut()是 pandas 中基于分位数的数值分箱函数,核心是按数据的分位数将数值划分为指定数量的「等频区间」(每个区间包含的样本数大致相等),是实现 “相对分级 / 评分” 的核心工具(如 RFM 评分)。qcut的核心价值是基于数据分布的相对分箱,不依赖绝对阈值,能适配非均匀分布的业务数据(如用户消费行为、购买时间),是 RFM 评分、用户分层等场景中实现 “公平分级” 的最优选择。排序 → 按分位数等频切割 → 自定义标签映射 → 适配业务规则。
2025-12-24 17:16:34
372
原创 RFM用户画像分析(前期数据准备)(销售分析)
计算RFM前的数据准备R(最近消费):计算最近一次消费时间与基准时间(如代码中固定的 2024-12-31)的间隔,即「最近消费距今天数 = 基准时间 - 最近消费时间F(购买频次):衡量用户消费频繁程度,即「购买频次 = 用户总购买量 ÷(首次购买至最近购买的时间跨度 + 1)」,加 1 可避免时间跨度为 0 时的除法异常;M(消费金额):统计用户累计消费能力,即「用户消费总金额 = 该用户所有订单金额之和。
2025-12-24 16:11:04
904
原创 2025.12.23 python积累
使用select_dtypes()函数将基本信息展示分为两种,“数值类型”和“非数值类型”,利用map()函数的映射,将月份对应季节填入表中,时间数据分箱。使用map()函数的映射功能对数据进行数据标准化。4.基本信息展示(df.describe())3.查看数据缺失值(df.isnull())2.数据预览(df.head())1.数据形状(多少行多少列)这样方便分析数据特征。
2025-12-23 17:51:51
208
原创 python类的书写和调用
python运行# ---------------------- 第一步:定义类 ----------------------"""员工话费统计类(封装属性和方法)功能:1. 加载数据 2. 按城市分组统计 3. 关联维度表"""# 初始化方法(构造函数):创建实例时自动执行,初始化属性# 实例属性:存储主数据、维度数据、处理后的结果self.main_df = main_data # 主表(城市、姓名、话费)self.dim_df = dim_data # 维度表(城市、区域、负责人)
2025-12-10 15:31:25
305
原创 python中filter()筛选函数使用方法
filter()是一个非常实用的函数,它用于。它提供了三种灵活的筛选方式:按标签名包含的字符串、按正则表达式匹配标签名、以及按指定的标签列表进行筛选。
2025-11-23 23:09:19
277
原创 jdbc数据库Java连接
mysql5 用5的驱动 mysql-connector-java-5.0.3-bin.jar mysql8 用8的驱动 mysql-connector-java-8.0.22.jar。
2024-04-20 21:27:10
377
2
转载 关于Linux的实验报告
2.可以在wireshark中看到有许多的报文:我们这里要研究的是HTTP协议所以我们选择随机一个HTTP报文,点击analyze后再点击Follow TCP Stream子菜单跟踪TCP流,选择其中任意一对HTTP请求和响应,分析其请求和响应的格式从我的结果可以看出所运用的请求方法是GET,URL是/success.txt,版本是HTTP/1.1,最后一项的是否采取持续连接中是keep-alive,这表明是持续连接,然后下面的蓝色部分是网站的信息....
2024-04-19 14:51:26
497
1
原创 Java的基本数据类型的类型转换
1.基本数据类型的数值的表述范围:double>float>long>int>short/char>byte(其中float>long的原因:由于浮点数的存储方式与整型不同)2.基本数据类型占内存:3.注释:Java基本数据类型的类型转换,是根据基本数据类型的表述范围的大小来操作的。
2024-04-13 23:12:08
222
1
原创 String、StringBuffer、StringBuilder的区别
String、StringBuffer、StringBuilder的区别
2024-03-21 20:58:57
152
1
原创 为什么Integer类型中1000 ==1000为false,100==100为true
为什么Integer类型中1000 ==1000为false,100==100为true
2024-03-12 08:13:35
392
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅