关联规则算法怎么实现？Python代码、PowerBI可视化详细解释给你听（下-实战篇）

最新推荐文章于 2025-05-04 02:20:21 发布

DataMiningSharer

最新推荐文章于 2025-05-04 02:20:21 发布

阅读量3.1k

点赞数 5

分类专栏：应用案例数据可视化爬虫与存储文章标签：算法 python 数据挖掘

本文链接：https://blog.youkuaiyun.com/lqw844597536/article/details/121666184

版权

本文通过实例详细讲解如何使用Python的mlxtend库实现关联规则算法，包括数据预处理、apriori算法及计算支持度、置信度、提升度。并介绍如何在PowerBI中导入Python脚本生成数据表并进行动态可视化展示，帮助业务人员理解和应用关联规则。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在上一篇中，我讲解了关联规则的原理和实现步骤，如果大家看懂了，其实很好理解。但是说起来容易做起来难，如何通过工具将原始数据处理得到有效可靠的结果还是会存在问题。实际工作是让你解决问题而不只是说出解决思路。本篇就是在理论的基础上，结合实际数据来展示如何使用Python实现关联规则和如何在PowerBI中导入Python脚本生成数据表并以可视化的方式动态展示。

在使用Python解决某个问题时，其实并不是从0到1一步一步搭建，这个过程很繁琐，有时候为了实现一个小小的效果可能得绕很大的弯，所以就跟“调参侠”一样，我们往往使用别的搭好的梯子。这也是为什么Python语言这么受欢迎，因为它有很完善的开源社区和不计其数的工具库库来实现某个目的。我们在实现计算关联规则时，使用的是机器学习库mlxtend中的apriori，fpgrowth，association_rules算法。
apriori 是一种流行的算法，用于在关联规则学习中应用提取频繁项集。apriori 算法旨在对包含交易的数据库进行操作，例如商店客户的购买。如果满足用户指定的支持阈值，则项集被认为是“频繁的”。例如，如果支持阈值设置为 0.5 (50%)，则频繁项集被定义为在数据库中至少 50% 的所有事务中一起出现的一组项目。

一、数据集

#导入相关的库
import pandas as pd   
import mlxtend  #机器学习库
#编码包
from mlxtend.preprocessing import TransactionEncoder  
#关联规则计算包
from mlxtend.frequent_patterns import apriori, fpmax, fpgrowth,association_rules
pd.set_option('max_colwidth',150)  #对pandas显示效果设置，列显示字段长度最长为150个字符          #导入数据集
Order = pd.read_excel("D:/orders.xlsx")