一张表说明判别模型和生成模型的区别与联系

本文探讨了机器学习中判别模型与生成模型的区别及联系,包括各自的优劣势、常见模型示例及其在自然语言处理领域的应用。
类别判别模型生成模型
特点在有限样本下建立判别函数,寻找不同数据间的最优分类面,目标是实现分类首先建立样本的联合概率分布,再利用模型推理预测。要求已知样本无穷或尽可能的大
区别估计条件概率分布p(y|x)p(y|x)估计联合概率分布p(x,y)p(x,y)
联系生成模型可推导出判别模型判别模型无法得到生成模型
常见模型举例ME/MEMM/CRF/LR/DT/NN…NB/HMM/GMM/LDA/Restricted Boltzmann Machine…
优势1.面向分类边界的训练,比使用纯概率方法高级
2.能清晰地分辨出类别之间的差异特征
3.可用于多类的学习和识别
4.判别模型比生成模型更简单,容易学习
1.面向整体的数据分布
2.能够反应同类数据本身的相似度
3.模型可以通过增量学习得到
4.可用于数据不完整的情况
劣势1.不能反应类别本身的特性,只能用于类别识别
2.在训练时需要考虑所有数据的元组,数据量增大时,效率底下
3.缺乏灵活的建模工具和插入先验知识的方法。黑盒操作:变量之间的关系不可视
1.学习时需计算所有变量的联合概率,资源使用量大
2.分类性能不高。类别识别精度有限
3.学习和计算过程复杂
性能较高较低
NLP应用所有序列标注和结构化学习文本分类/词性标注等

引自:《NLP汉语自然语言处理原理与实践》郑捷

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值