在Elasticsearch的`Frequent item sets aggregation`中,项集(Item Set)和支持度(Support)是两个核心概念,用于分析数据中频繁出现的项目组合及其频率。以下是它们的定义和作用:
1.项集(Item Set)
项集是指一组经常一起出现的项目。在数据分析中,项集可以帮助我们发现数据中频繁出现的组合模式。例如:
• 在电商场景中,项集可以是经常一起购买的商品组合,如`["Women's Clothing", "Women's Shoes"]`。
• 在日志分析中,项集可以是经常一起出现的日志事件。
在Elasticsearch的`Frequent item sets aggregation`中,项集是由指定字段中的值组成的集合。例如,以下查询定义了两个字段`category.keyword`和`geoip.city_name`,并查找这些字段中频繁出现的项目组合:
```json
{
"aggs": {
"my_agg": {
"frequent_item_sets": {
"fields": [
{"field": "category.keyword"},
{"field": "geoip.city_name"}
]