地理信息|空间频繁模式与关联规则发掘

本文探讨了地理信息中的空间频繁模式与关联规则挖掘。关联规则挖掘用于发现数据中项集之间的有趣关联,常见于购物篮分析等场景。关键因素包括支持度和置信度。文中介绍了Apriori算法以及空间关联规则的挖掘方法,如基于事物的空间关联规则挖掘(RFCM模型)和基于聚类的空间关联规则挖掘。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

同样的,先从数据挖掘开始,然后结合地理上升到空间层面。

 

频繁模式:频繁出现在数据集中的模式(等于没说),如项集、子序列、子结构,对应频繁**,如频繁项集。

 

关联规则挖掘:发现大量数据中项集之间有趣的关联。

应用主要有购物篮分析、交叉销售、贩卖分析和分类设计。

 

简单来说就是通过数据观察两个类别的关系,如果关系大,就将这两件物品捆绑起来,最常见的就是商场的商品布局。最为经典的就是沃尔玛的啤酒与纸尿布故事了。美国新津妈妈在家照顾婴儿,爸爸下班顺便买纸尿布,商家在纸尿布旁放啤酒瓜子花生米,爸爸一看,甚得我心,顺手一捎,就是销量,沃尔玛大赚。

 

这个应用里最为重要的因素有两个:支持度和置信度。

支持度衡量规则的有用性,指用户同时买A和B的比例。

置信度衡量规则的确定性,指用户在买了A的基础上又买了B的比例(没错就是条件概率)。

 

接下来是关联规则的具体术语(科学家保持高冷的假把戏,看不看无所谓,狗头)

 

 

 


 

关联规则挖掘的步骤

  1. 找出所有频繁项集。

  2. 由频繁项集产生强关联规则。(支持度和置信度都达到阈值)

 

这里常用的一个算法是Apriori算法,算法思想:频繁项集的子集也一定

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值