【机器学习系列(4)】模式发现与推荐系统:关键技术深度解析
一、关联规则挖掘(Apriori算法)
1. 算法核心原理
- 支持度(Support):项集出现的频率
- 置信度(Confidence):规则成立的条件概率
- 提升度(Lift):规则的有效性指标
from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import apriori, association_rules
import pandas as pd
# 模拟交易数据
transactions = [
['牛奶', '面包', '啤酒'],
['牛奶', '尿布'],
['面包', '啤酒', '尿布'],
['牛奶', '尿布', '啤酒']
]
# 数据预处理
te = TransactionEncoder()
te_ary = te.fit(transactions).transform(transactions)
df = pd.DataFrame(te_ary, columns=te.columns_)
# 挖掘频繁项集
frequent_itemsets

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



