46、机器学习与数据挖掘中的算法设计

机器学习与数据挖掘中的算法设计

1. 模型相关基础

1.1 HMM与CRF

隐马尔可夫模型(HMM)可以由条件随机场(CRF)建模。CRF中的概率分布通常由变量子集上的因子乘积表示,HMM中的概率 $P(n′|n)$ 和 $P(s|n)$ 可以轻松转换为这些因子。CRF通过因子能够定义变量之间更复杂的依赖关系,这也是它在自然语言处理中比HMM更受欢迎的原因。

1.2 图形模型学习

学习图形模型可分解为两个子问题:
- 结构已知时,问题是学习参数,即概率分布。通常采用似然最大化或贝叶斯先验最大化(MAP)等方法。
- 结构未知时,需要同时学习结构和参数。

1.3 统计关系学习

统计关系学习旨在将归纳逻辑编程与概率模型联系起来,是一个活跃的研究领域。

2. 学习与表示变换

2.1 变换输入空间的动机

改变输入空间 $X$ 的动机是使寻找规律或模式更加直接。可以通过无监督学习或有监督学习来实现,其中无监督学习由待解决的预测任务引导。

2.2 无监督学习的应用

无监督学习常用于以下方面:
- 估计输入空间中的密度。
- 将数据聚类成组。
- 找到大多数数据所在的流形。
- 以某种方式进行去噪。

总体原则是找到训练数据的最简单表示,同时尽可能保留关于示例的信息。“简单性”的常见定义方式有:低维表示、稀疏表示和独立表示。

2.2.1 低维表示

寻找低维表示时,我们希望找到更小的表示,同时保

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值