通过计算实例简单地理解PatchCore异常检测

FriendshipT

于 2025-06-24 19:45:47 发布

阅读量1k

点赞数 37

CC 4.0 BY-SA版权

分类专栏：人工智能知识点人工智能应用文章标签：人工智能异常检测 PatchCore

本文链接：https://blog.youkuaiyun.com/FriendshipTang/article/details/148877810

人工智能应用同时被 2 个专栏收录

25 篇文章

订阅专栏

人工智能知识点

15 篇文章

订阅专栏

通过计算实例简单地理解PatchCore异常检测

前言
相关介绍
通过计算实例简单地理解PatchCore异常检测
参考文献

在这里插入图片描述

前言

由于本人水平有限，难免出现错漏，敬请批评改正。
更多精彩内容，可点击进入Python日常小操作专栏、OpenCV-Python小应用专栏、YOLO系列专栏、自然语言处理专栏或我的个人主页查看
基于DETR的人脸伪装检测
YOLOv7训练自己的数据集（口罩检测）
YOLOv8训练自己的数据集（足球检测）
YOLOv10训练自己的数据集（交通标志检测）
YOLOv5：TensorRT加速YOLOv5模型推理
YOLOv5：IoU、GIoU、DIoU、CIoU、EIoU
玩转Jetson Nano（五）：TensorRT加速YOLOv5目标检测
YOLOv5：添加SE、CBAM、CoordAtt、ECA注意力机制
YOLOv5：yolov5s.yaml配置文件解读、增加小目标检测层
Python将COCO格式实例分割数据集转换为YOLO格式实例分割数据集
YOLOv5：使用7.0版本训练自己的实例分割模型（车辆、行人、路标、车道线等实例分割）
使用Kaggle GPU资源免费体验Stable Diffusion开源项目

通过计算实例简单地理解PatchCore异常检测

总体流程

在这里插入图片描述

训练阶段

训练数据（正常图像）

# 图像1 (正常)
[ [1, 1, 1],
  [1, 1, 1],
  [1, 1, 1] ]

# 图像2 (正常)
[ [2, 2, 2],
  [2, 2, 2],
  [2, 2, 2] ]

特征提取

# 图像1的特征提取
原始图像：
[[1,1,1],
 [1,1,1],
 [1,1,1]]

划分为4个Patch：
Patch1 (左上): [[1,1],[1,1]] → 特征 = [mean=1.0, max=1.0] → [1.0, 1.0]
Patch2 (右上): [[1,1],[1,1]] → [1.0, 1.0]
Patch3 (左下): [[1,1],[1,1]] → [1.0, 1.0]
Patch4 (右下): [[1,1],[1,1]] → [1.0, 1.0]

# 图像2的特征提取
原始图像：
[[2,2,2],
 [2,2,2],
 [2,2,2]]

Patch1: [2.0, 2.0]
Patch2: [2.0, 2.0]
Patch3: [2.0, 2.0]
Patch4: [2.0, 2.0]

训练图像1 (3x3像素)     训练图像2 (3x3像素)
┌───────┐              ┌───────┐
│ 1 1 1 │              │ 2 2 2 │
│ 1 1 1 │  特征提取     │ 2 2 2 │  特征提取
│ 1 1 1 │  ========>   │ 2 2 2 │  ========> 
└───────┘              └───────┘

特征图 (2x2网格，每个单元代表一个Patch的特征向量):
┌───────────┬───────────┐
│ [1.0,1.0] │ [1.0,1.0] │   <- 图像1的四个Patch特征
├───────────┼───────────┤
│ [1.0,1.0] │ [1.0,1.0] │
└───────────┴───────────┘

┌───────────┬───────────┐
│ [2.0,2.0] │ [2.0,2.0] │   <- 图像2的四个Patch特征
├───────────┼───────────┤
│ [2.0,2.0] │ [2.0,2.0] │
└───────────┴───────────┘

关键说明：

每个3x3图像被划分为2x2=4个Patch
每个Patch提取两个特征值：[平均值, 最大值]
正常图像的所有Patch特征高度一致

Coreset 采样（假设 coreset_ratio=0.5 → K=4）

原始特征库 M = 8个点: 
    [1,1], [1,1], [1,1], [1,1], [2,2], [2,2], [2,2], [2,2]
步骤：
1. 随机选择初始点：比如 [1.0, 1.0]
2. 计算所有点到当前核心库的距离：
   - 到 [1.0,1.0] 的距离：
     [1.0,1.0]: 0
     [2.0,2.0]: √[(2-1)²+(2-1)²] = √2 ≈ 1.41
3. 选择最远点 [2.0,2.0] 加入核心库
   
4. 计算所有点到当前核心库的距离：
   - 到最近点的距离：
     [1.0,1.0]：min(到[1.0,1.0]=0, 到[2.0,2.0]=1.41) → 0
     [2.0,2.0]：min(0, 1.41) → 0
5. 所有点距离为0？随机选择下一个点 [1.0,1.0]（但已存在）

最终核心库 C（K=4）：
C = [
  [1.0, 1.0],
  [2.0, 2.0],
  [1.0, 1.0],  # 重复点，实际会去重
  [2.0, 2.0]   # 重复点
]

去重后：
C = [
  [1.0, 1.0],
  [2.0, 2.0]
]

Coreset作用：

原始8个点 → 压缩为2个代表点
保持原始分布特征（两个聚类中心）
计算效率提升4倍

原始特征库 M = 8个点: 
    [1,1], [1,1], [1,1], [1,1], [2,2], [2,2], [2,2], [2,2]

Coreset采样 (K=4):
1. 随机选起点: 选择 [1,1] -> C = [[1,1]]
2. 计算所有点到C的距离:
   - [1,1]: 0
   - [2,2]: √[(2-1)²+(2-1)²] = √2 ≈ 1.41
3. 选最远点 [2,2] 加入C -> C = [[1,1], [2,2]]
4. 重新计算距离:
   - 所有点距离为0 (因M中只有两种点)
5. 随机选两个点补充 (因K=4): 
   C = [[1,1], [2,2], [1,1], [2,2]]
6. 去重后核心库: C = [[1,1], [2,2]]

预测阶段

测试数据

训练图像1 (正常)       训练图像2 (正常)       测试图像 (右下角异常)
┌───┬───┬───┐          ┌───┬───┬───┐          ┌───┬───┬───┐
│ 1 │ 1 │ 1 │          │ 2 │ 2 │ 2 │          │ 1 │ 1 │ 1 │
├───┼───┼───┤          ├───┼───┼───┤          ├───┼───┼───┤
│ 1 │ 1 │ 1 │          │ 2 │ 2 │ 2 │          │ 1 │ 1 │ 1 │
├───┼───┼───┤          ├───┼───┼───┤          ├───┼───┼───┤
│ 1 │ 1 │ 1 │          │ 2 │ 2 │ 2 │          │ 1 │ 1 │10 │
└───┴───┴───┘          └───┴───┴───┘          └───┴───┴───┘

特征提取

测试图像：
[[1,1,1],
 [1,1,1],
 [1,1,10]]  # 右下角异常

Patch1 (左上): [[1,1],[1,1]] → [1.0, 1.0]
Patch2 (右上): [[1,1],[1,1]] → [1.0, 1.0]
Patch3 (左下): [[1,1],[1,1]] → [1.0, 1.0]
Patch4 (右下): [[1,1],[1,10]] → [mean=(1+1+1+10)/4=3.25, max=10] → [3.25, 10.0]

计算最近邻距离（输出异常分数）

核心库 C = = [
  [1.0, 1.0],
  [2.0, 2.0]
]
测试特征 vs 核心库 C:
1. Patch1 [1.0, 1.0]:
   - 到 [1.0,1.0]距离 = 0
   - 到 [2.0,2.0]距离 = √[(1)²+(1)²] = √2 ≈ 1.41
   → 最近邻距离 = min(0, 1.41) = 0

2. Patch2 [1.0, 1.0]: 同上 → 0

3. Patch3 [1.0, 1.0]: 同上 → 0

4. Patch4 [3.25, 10.0]:
   - 到 [1.0,1.0]距离 = √[(3.25-1)² + (10-1)²] = √[5.0625 + 81] = √86.0625 ≈ 9.28
   - 到 [2.0,2.0]距离 = √[(3.25-2)² + (10-2)²] = √[1.5625 + 64] = √65.5625 ≈ 8.10
   → 最近邻距离 = min(9.28, 8.10) = 8.10

异常分数 = max([0.0, 0.0, 0.0, 8.10])=8.10

异常分数图生成

块级异常分数：
[ [0.0, 0.0],   # 对应Patch1和Patch2
  [0.0, 8.10] ] # 对应Patch3和Patch4

上采样到像素级 (3×3):
每个像素值 = 覆盖该像素的所有块分数的平均值
最终热力图:
┌───────┬───────┬───────┐
│ 0.00  │ 0.00  │ 0.00  │
├───────┼───────┼───────┤
│ 0.00  │ 2.025 │ 4.05  │
├───────┼───────┼───────┤
│ 0.00  │ 4.05  │ 8.10  │
└───────┴───────┴───────┘

参考文献

[1] PatchCore 源代码地址：https://github.com/amazon-science/patchcore-inspection.git
[2] PatchCore 论文地址：https://arxiv.org/abs/2106.08265
[3] https://link.springer.com/content/pdf/10.1007/s11263-020-01400-4.pdf
[4] https://www.mvtec.com/company/research/datasets/mvtec-ad/
[5] https://blog.youkuaiyun.com/xiao3_tai/article/details/136504813
[6] https://blog.youkuaiyun.com/m0_63828250/article/details/137158892
[7] https://blog.youkuaiyun.com/WD_SS/article/details/139673512

由于本人水平有限，难免出现错漏，敬请批评改正。
更多精彩内容，可点击进入Python日常小操作专栏、OpenCV-Python小应用专栏、YOLO系列专栏、自然语言处理专栏或我的个人主页查看
基于DETR的人脸伪装检测
YOLOv7训练自己的数据集（口罩检测）
YOLOv8训练自己的数据集（足球检测）
YOLOv10训练自己的数据集（交通标志检测）
YOLOv5：TensorRT加速YOLOv5模型推理
YOLOv5：IoU、GIoU、DIoU、CIoU、EIoU
玩转Jetson Nano（五）：TensorRT加速YOLOv5目标检测
YOLOv5：添加SE、CBAM、CoordAtt、ECA注意力机制
YOLOv5：yolov5s.yaml配置文件解读、增加小目标检测层
Python将COCO格式实例分割数据集转换为YOLO格式实例分割数据集
YOLOv5：使用7.0版本训练自己的实例分割模型（车辆、行人、路标、车道线等实例分割）
使用Kaggle GPU资源免费体验Stable Diffusion开源项目