Day Six——使用pandas寻找关联规则

Day Six——使用pandas寻找关联规则

完整代码及数据地址

第一部分数据data.xls

第二部分数据apriori.txt

第一部分——使用Kmean聚类数据

对应函数programmer_1

步骤:

  1. 读取数据,对类别进行字符化,转换为’A’,’B’,’C’……
  2. 使用Kmeans进行离散化,这里聚类前要将数据离散化as_matrix()
  3. 得到聚类中心、进行分类统计,最后合并为新的DataFrame
  4. 计算边界点(相邻两列的均值),转换NaN为0.0

输出如下:

        1           2           3           4
A     0.0    0.178855    0.258081    0.352043
An  240.0  359.000000  278.000000   53.000000
B     0.0    0.154031    0.306200    0.564697
Bn  342.0  384.000000  194.000000   10.000000
C     0.0    0.202038    0.288739    0.423325
Cn  297.0  392.000000  206.000000   35.000000
D     0.0    0.173544    0.252731    0.359726
Dn  292.0  370.000000  224.000000   44.000000
E     0.0    
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值