在做商品关联度分析的时候,我们可能会遇到各种各样格式的数据,而对数据的格式往往会影响关联度分析,一般来说,数据源大多有三种格式:
- 第一种是事务型交易数据,典型的数据格式是每个数据行以订单ID或以客户ID作为关联分析的参照维度,如果同一个订单中有多少类商品,将会有多个数据行记录。如图下所示:
- 第二种是合并后的交易数据,数据格式是每个数据行以订有单ID或以客户ID作为关联分析的参照维度,如果不同商品在同一个订单中,那么将会有多个数据行记录。
- 第三种是真值表格数据,每个数据行以订有单ID或以客户ID,列是每个要关联物品是否购买值,通常T或F表示,不过3.第三种是真值表格数据,每个数据行以订有单ID或以客户ID,列是每个要关联商品是否购值,通常用T或F表示。不过我们这里的列表示每个要关联商品要购买的个数,这种数据格式暂时称为假真值表格数据
在关联性分析时,对第一、第二种数据格式的操作比较复杂,而第三种几乎不再对数据格式进行任何操作就可以进行关联性分析。因此,为了方便起见,如何将第一第二种数据格式转化为第三种格式将会很大影响关联性的方便程度,而Excel给我们提供了一个很简单的转化方式,透视表,以下是它的操作步骤。
- 第一步,选择所要转化的数据,点击插入,后点击推荐的数据透明表格。