Elasticsearch:注册域处理器 - registered domain processor

该文描述了一个Elasticsearch中的处理器,用于从完全限定域名(FQDN)中提取注册域、子域和顶级域,利用Mozilla公共后缀列表。处理器可以添加这些组件到文档的特定字段或根部,示例展示了如何处理www.example.ac.uk和www.elastic.co这两个FQDN。

从完全限定域名 (fully qualified domain name - FQDN) 中提取注册域(也称为有效顶级域或 eTLD)、子域和顶级域。 使用 Mozilla 公共后缀列表中定义的注册域。

它有如下的选项:

名称必须默认描述
fieldyes包含源 FQDN 的字段。
target_fieldno<empty string>包含提取的域组件的对象字段。 如果是<空字符串>,则处理器将组件添加到文档的根。
ignore_missingnotrue如果为 true 并且缺少任何必填字段,则处理器会安静退出而不修改文档。
descriptionno-处理器的描述。 对于描述处理器或其配置的用途很有用。
ifno-有条件地执行处理器。 请参阅有条件地运行处理器
ignore_failurenofalse忽略处理器的故障。 请参阅处理管道故障
on_failureno-处理处理器的故障。 请参阅处理管道故障
tagno-处理器的标识符。 对于调试和指标很有用。

示例

以下示例说明了注册域处理器的使用:

POST _ingest/pipeline/_simulate
{
  "pipeline": {
    "processors": [
      {
        "registered_domain": {
          "field": "fqdn",
          "target_field": "url"
        }
      }
    ]
  },
  "docs": [
    {
      "_source": {
        "fqdn": "www.example.ac.uk"
      }
    }
  ]
}

上面的命令返回:

{
  "docs": [
    {
      "doc": {
        "_index": "_index",
        "_id": "_id",
        "_version": "-3",
        "_source": {
          "fqdn": "www.example.ac.uk",
          "url": {
            "registered_domain": "example.ac.uk",
            "top_level_domain": "ac.uk",
            "domain": "www.example.ac.uk",
            "subdomain": "www"
          }
        },
        "_ingest": {
          "timestamp": "2023-07-05T01:27:04.720322Z"
        }
      }
    }
  ]
}

我们再来测试一下 www.elastic.co 的情况:

POST _ingest/pipeline/_simulate
{
  "pipeline": {
    "processors": [
      {
        "registered_domain": {
          "field": "fqdn",
          "target_field": "url"
        }
      }
    ]
  },
  "docs": [
    {
      "_source": {
        "fqdn": "www.elastic.co"
      }
    }
  ]
}

上面返回的结果是:

{
  "docs": [
    {
      "doc": {
        "_index": "_index",
        "_id": "_id",
        "_version": "-3",
        "_source": {
          "fqdn": "www.elastic.co",
          "url": {
            "registered_domain": "elastic.co",
            "top_level_domain": "co",
            "domain": "www.elastic.co",
            "subdomain": "www"
          }
        },
        "_ingest": {
          "timestamp": "2023-07-05T01:28:21.550629Z"
        }
      }
    }
  ]
}
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值