机器学习（三）：Apriori算法（算法精讲）

最新推荐文章于 2025-06-19 10:46:07 发布

原创

最新推荐文章于 2025-06-19 10:46:07 发布 · 2.5k 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器学习Apriori算法 #Apriori算法 #Apriori算法原理 #Apriori #关联规则

机器学习（三）：Apriori算法（算法精讲）

在这里插入图片描述
上面图片就是Apriori算法的一部分流程，是不是看不太懂，当初看理解这个算法也花了不少时间，在这里我先介绍一下关联规则挖掘。

Apriori算法——关联规则挖掘

1）关联规则挖掘

首先，关联规则挖掘的目的是找出事物之间存在的隐藏的关系，比如大家都知道的经典的案例啤酒和尿布的的故事，用我们人的思维来思考的话，男性在买尿布的时候会买几瓶啤酒，这二者并没有什么因果关系。然而通过对海量数据进行关联分析，却能够发现这个有趣的知识，在超市调整货架后，明显的提升了超市啤酒尿布的销量。这个就是关联规则挖掘，往往能达到让人意想不到的效果。

2）基本概念

关联规则的表示：尿布 => 啤酒 [support=2%；confidence=70%] 。这个就是关联规则的表示方法，其中支持度（support）和（置信度）confidence是两个衡量这个规则是否有趣的度量标准。
支持度：按照上面的例子来讲，已知了支持度是2%，意味着所有事务的2%显示同时买了泡面和火腿。如果这个有疑惑大可不必着急，这个在还会在后续的例子里面具体阐述。
置信度：例如上述的置信度为70%，意味着所有买泡面的顾客，70%的顾客都买了火腿。
项集：项集就是项的集合，例如：{矿泉水，泡面，火腿} 这是一个3项集，项集的出现频度是包含项集的事务数，把它记作支持度计数，通俗的来说，假设有三个顾客分别买了{矿泉水，泡面，火腿}、{矿泉水，泡面，火腿、牛栏山}、{矿泉水，火腿}。那么这个

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。