19、市场篮子分析:数据编码与Apriori算法应用

Apriori算法与市场篮子分析

市场篮子分析:数据编码与Apriori算法应用

1. 事务数据特征与数据编码

1.1 数据处理代码示例

在处理事务数据时,首先需要对数据进行排序和编码。以下是一段Python代码示例,用于对事务数据进行排序和编码:

# 2. sort items in alphabetical order
list_nondup_sort_items = sorted(list(set(list_dup_unsort_items)))

# initialize DataFrame with all elements having False value
# name the columns the elements of list_dup_unsort_items
manual_df = pandas.DataFrame(
    False, 
    index=range(len(ll)), 
    columns=list_dup_unsort_items
)

# change False to True if element is in individual transaction list
# each row is represents the contains of an individual transaction
# (sublist from the original list of lists)
for i in range(len(ll)):
    for j in ll[i]:
        manual_df.loc[i, j] = True

# return the True/False
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值