机器学习算法:朴素贝叶斯与线性回归详解
1. 朴素贝叶斯分类器概述
朴素贝叶斯模型是一组极其快速且简单的分类算法,适用于高维数据集。由于其训练和预测速度快,可调参数少,常作为分类问题的快速基线模型。
1.1 贝叶斯分类原理
朴素贝叶斯分类器基于贝叶斯分类方法,依赖贝叶斯定理。在贝叶斯分类中,我们关注给定观测特征下标签的概率。若要在两个标签之间做出决策,可计算每个标签的后验概率之比。为此,需要一个生成模型来计算每个标签的概率。“朴素”一词源于对生成模型的简单假设,不同类型的朴素贝叶斯分类器基于不同的朴素假设。
1.2 高斯朴素贝叶斯
高斯朴素贝叶斯是最容易理解的朴素贝叶斯分类器,它假设每个标签的数据都来自简单的高斯分布。以下是使用 sklearn
库实现高斯朴素贝叶斯分类的示例代码:
%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns; sns.set()
from sklearn.datasets import make_blobs
X, y = make_blobs(100, 2, centers=2, random_state=2, cluster_std=1.5)
plt.scatter(X[:, 0], X[:, 1], c=y, s=50, cmap='RdBu');
from sklearn.naive_bayes import GaussianNB
model = Gauss