数据挖掘最早使用的方法是关联分析,主要应用于零售业。其中最有名的是售货 篮分析,帮助售货商制定销售策略。数据挖掘是从海量的数据里寻找有价值的信息和数据。数据挖掘中常用的算法有:关联规则分析法(解决事件之间的关联问题)、决策树分类法(对数据 和信息进行归纳和分类)、遗传算法(基于生物进化论及分子遗传学理论提出 的)、神经网络算法(模拟人的神经元功能)等。 随着信息时代的到来,数据挖掘在金融、医疗、通信等方面得到了广泛的应用。
关联规则挖掘是一种基于规则的机器学习算法,该算法可以在大数据库中发现感兴趣的关系。它的目的是利用一些度量指标来分辨数据库中存在的强规则。也即是说关联规则挖掘是用于知识发现,而非预测,所以是属于无监督的机器学习方法。
关联规则挖掘可以让我们从数据集中发现项与项(item与item)之间的关系,它在我们的生活中有很多应用场景,“购物篮分析”就是一个常见的场景,这个场景可以从消费者交易记录中发掘商品与商品之间的关联关系,进而通过商品捆绑销售或者相关推荐的方式带来更多的销售量。
在我查询资料的过程中,大多数文章全都在讲关联规则概念、基本原理、算法、指标等等,说直白点都是从学术文章抄出来的,没有真正的说明关联规则在现实场景中的应用的意义和作用,也没有介绍行业中能够挖掘关联分析的软件。
l 应用场景及案例
(1) 购物篮分析</