【ML小结6】关联分析与序列模式关联分析

本文介绍了关联分析的基本概念,包括支持度、置信度和提升度,并详细讲解了Apriori算法的原理和步骤。接着探讨了序列模式关联分析,特别是GSP算法,包括其本质、步骤和缺点。关联分析旨在发现数据项之间的关系,而序列模式关联分析则关注事物发展的前后关联性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、关联分析

关联分析主要是用于从数据集中发现数据项之间的关系

1. 基本概念

1.1 支持度

X → Y 的支持度表示项集 {X,Y} 在总项集中出现的概率:
s u p p o r t ( X → Y ) = P ( X , Y ) support(X\rightarrow Y)=P(X,Y) support(XY)=P(X,Y)
用于衡量同时满足X和Y的概率。

1.2 置信度

X → Y 的置信度表示在先决条件 X 发生的情况下,由规则 X → Y 推出 Y 的概率。
c o n f i d e n t ( X → Y ) = P ( Y ∣ X ) confident(X\rightarrow Y)=P(Y|X) confident(X→</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值