Rare Event Analysis

本文探讨了在大量数据中寻找稀有事件的重要性及其在多个领域的应用案例,如网络入侵检测、信用卡欺诈检测等,并指出了传统策略在处理这类问题时的不足。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Background

Drowning in data, starving for knowledge.

这里写图片描述

如同矿石提炼黄金的过程,大量的数据中,只蕴含了少量有趣的事件。这些少量事件中,出现频次相对更低的稀有事件,可能导致显著的结果,且往往是负面的。

应用

  • 网络入侵检测
  • 信用卡欺诈检测
  • 病理诊断

传统策略在稀有事件分析中的不足

以网络KPI问题定位为例:

  • 异常点处理:考虑KPI问题点和数据打点问题点的区别;
  • 特征选取和提取:
> a <- c(rnorm(100), 15)
> b <- c(rnorm(100), 15)
> cor(a, b, method ="spearman")
[1] 0.1072103
> cor(a, b, method = "pearson")
[1] 0.7590896
  • 评估标准不适用
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值