机器学习中的非朴素贝叶斯分类与面部检测应用
非朴素贝叶斯分类
核密度可视化与非朴素贝叶斯概念
在物种分布的可视化中,核密度表示法相较于简单的散点图,能更清晰地呈现两种物种观测数据的地理分布。接下来我们将介绍基于核密度估计(KDE)的贝叶斯生成分类,展示如何使用Scikit - Learn架构创建自定义估计器。
在朴素贝叶斯分类中,我们为每个类别创建简单的生成模型,使用的是轴对齐的高斯分布。而利用KDE这样的密度估计算法,我们可以去掉“朴素”的元素,为每个类别使用更复杂的生成模型进行相同的分类,这仍然是贝叶斯分类,但不再是朴素的。
生成分类的一般方法
生成分类的一般步骤如下:
1. 按标签分割训练数据。
2. 对每个子集拟合KDE,以获得数据的生成模型。这样可以为任何观测值和标签计算似然。
3. 根据训练集中每个类别的样本数量,计算类先验概率。
4. 对于未知点,计算每个类别的后验概率,后验概率最大的类别即为该点分配的标签。
自定义估计器的实现
以下是在Scikit - Learn框架中实现该算法的代码:
from sklearn.base import BaseEstimator, ClassifierMixin
import numpy as np
from sklearn.neighbors import KernelDensity
class KDEClassifier(BaseEstimator, ClassifierMixin):
"""Bayesi
超级会员免费看
订阅专栏 解锁全文
1306

被折叠的 条评论
为什么被折叠?



