生成式模型与判别式模型

本文介绍了生成式模型和判别式模型在机器学习中的应用。生成式模型如朴素贝叶斯,通过学习数据分布生成新数据;判别式模型如支持向量机,关注输入输出映射关系进行预测。两者各有优势,选择依赖于应用场景和数据特性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

生成式模型和判别式模型是机器学习中两种常见的模型类型。

  • 生成式模型,又称概率模型,是指通过学习数据的分布来建立模型P(y|x),然后利用该模型来生成新的数据。生成式模型的典型代表是朴素贝叶斯模型,该模型通过学习数据的分布来建立概率模型,然后利用该模型来生成新的数据。
  • 判别式模型,又称非概率模型,是指通过学习输入和输出之间的映射关系来建立模型y=f(x),然后利用该模型来预测新的输出。判别式模型的典型代表是支持向量机模型,该模型通过学习输入和输出之间的映射关系来建立分类模型,然后利用该模型来预测新的分类结果。


总的来说,生成式模型和判别式模型都有各自的优缺点,选择哪种模型取决于具体的应用场景和数据特征。

  • 常见生成式模型:决策树、朴素贝叶斯、隐马尔可夫模型、条件随机场、概率潜在语义分析、潜在狄利克雷分配、高斯混合模型;
  • 常见判别式模型:感知机、支持向量机、K临近、Adaboost、K均值、潜在语义分析、神经网络;
  • 逻辑回归既可以看做是生成式也可以看做是判别式。

### 李宏毅讲解生成式模型判别式模型 #### 生成式模型的特点 生成式模型旨在捕捉数据的真实分布,通过学习联合概率分布 \( p(x, y) \),其中 \( x \) 是输入特征而 \( y \) 是类别标签。这类模型能够模拟新样本的创建过程,适用于多种任务如图像合成、语音生成等[^3]。 对于分类问题而言,在应用贝叶斯定理时,可以通过寻找一组合适的高斯函数来构建模型集合,并利用最大似然估计方法评估各个候选模型的质量从而挑选最优者[^2]。 #### 判别式模型的工作原理 相比之下,判别式模型专注于建立条件概率分布 \( p(y|x) \),即给定特定输入下预测输出的概率。典型代表有支持向量机支持向量网络等算法。这些技术并不试图理解整个系统的运作机制而是直接针对决策边界进行优化以实现高效准确地分类目的[^4]。 #### Flow作为一种特殊的生成式模型 值得注意的是Flow也属于生成式模型的一种形式,它其他同类框架(例如GANsVAEs)共享相似属性——都是为了创造逼真的假象实例而设计出来的工具[^1]。 ```python import numpy as np from sklearn.datasets import make_classification from sklearn.model_selection import train_test_split from sklearn.naive_bayes import GaussianNB # 创建虚拟二元分类数据集 X, y = make_classification(n_samples=1000, n_features=20, random_state=42) # 将数据分为训练集测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=42) # 使用朴素贝叶斯作为简单的生成式模型示例 gnb = GaussianNB() gnb.fit(X_train, y_train) print(f"Test set accuracy: {gnb.score(X_test, y_test):.2f}") ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值