
离群点检测算法
文章平均质量分 60
太想吃螺蛳粉了我
这个作者很懒,什么都没留下…
展开
-
离群点检测性能评价指标
ps:分子为预测正确的样本数。原创 2025-03-07 11:51:40 · 178 阅读 · 0 评论 -
自然邻居搜索算法(NaN-Searching)-可以自动确定k
算法1,即NaN-Searching算法,是用来寻找数据集中每个点的自然邻域(Natural Neighbors,简称NaNs)的过程。自然邻域是指那些相互将对方视为邻居的数据点集合。算法1的核心思想是利用自然邻域的概念来动态地确定每个数据点的邻域大小,而不需要预设参数。原创 2025-03-06 21:50:18 · 297 阅读 · 0 评论 -
LOF算法
源自kimiLOF(局部离群因子,Local Outlier Factor)算法的原理是基于密度的异常检测方法,其核心思想是通过比较数据点与其邻域的密度差异来识别异常点。以下是LOF算法原理的详细阐述:LOF算法的核心在于“局部性”和“密度差异”。它认为,如果一个点的局部密度显著低于其邻域点的密度,那么这个点很可能是异常点。这种局部性使得LOF能够有效处理数据集中不同密度区域的异常检测问题,而不会被全局密度所误导。为了实现上述思想,LOF算法引入了几个关键概念:对于数据点 p ,其 k距离 是指点 p原创 2025-03-06 15:04:14 · 601 阅读 · 0 评论 -
箱型图(Box Plot)
箱型图(Box Plot)是一种用于展示数据分布情况的统计图表,通过它可以直观地识别数据中的异常值。原创 2025-03-04 16:54:04 · 336 阅读 · 0 评论 -
KNN、RNN、NaN
在反最近邻查询中,我们寻找的是将某个对象作为其最近邻的所有其他对象。换句话说,对于一个给定的对象( q ),反最近邻查询将返回所有那些以 q 作为它们自己最近邻的对象集合。它与传统的最近邻(Nearest Neighbor,简称NN)查询相反。在最近邻查询中,我们寻找数据库中距离给定点最近的对象。两个点互为最近邻,定义式如下。原创 2025-03-02 13:05:32 · 213 阅读 · 0 评论 -
z-score算法
z-score算法原理参考网址。原创 2025-02-22 20:32:03 · 166 阅读 · 0 评论