机器学习中的关联规则挖掘与监督学习算法
1. 关联规则挖掘
关联规则在数学上描述了各种交易中涉及的项目之间的关系。它通过研究两个项目集之间的关系,以 $X ⇒ Y$ 的形式呈现,其中 $𝑋⊂𝜋$,$𝑌⊂𝜋$,并且 $X$ 和 $Y$ 是不重叠的项目集,即 $𝑋∩𝑌 = ∅$。例如,关联规则可以表示为 ${helmets, balls} ⇒ {bike}$,这里 ${helmets, balls}$ 是 $X$,${bike}$ 是 $Y$。
1.1 规则类型
运行关联分析算法通常会从交易数据集中生成大量规则,但其中大多数是无用的。为了挑选出能产生有用信息的规则,可将其分为以下三种类型:
- 平凡规则 :许多规则总结了业务的常识,即使置信度高,也无法用于数据驱动的决策。例如:
- 从高楼跳下的人很可能死亡。
- 努力学习会在考试中取得更好的成绩。
- 随着温度下降,加热器的销量会增加。
- 在高速公路上超速驾驶会增加发生事故的几率。
- 难以解释的规则 :这些规则没有明显的解释,难以使用。因为它们只是探索了两个无关事件之间无意义的关系。例如:
- 穿红色衬衫的人往往在考试中得分更高。
- 绿色自行车更容易被盗。
- 买泡菜的人最终也会买尿布。
- 可操作的规则 :这是我们寻找的黄金规则,能被业务理解并带来洞察。例如:
- 规则 1:在用户的社交媒体账户上展示广告会提高销售的可能性。可操作项:建议产品的替代广告方式。
- 规则 2:创建更
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



