25、多分类、结构化输出预测与排序：原理、方法与应用

read5

于 2025-10-20 11:29:38 发布

阅读量13

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习：从理论到实践文章标签：多分类结构化输出预测排序

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/read5/article/details/154560555

机器学习：从理论到实践专栏收录该内容

44 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

多分类、结构化输出预测与排序：原理、方法与应用

在机器学习领域，多分类、结构化输出预测和排序是几个重要且具有挑战性的任务。下面将详细介绍这些任务的相关原理、方法以及如何应对其中的挑战。

多分类预测

多分类预测旨在将输入样本分配到多个类别中的一个。为了实现这一目标，我们需要定义合适的特征函数和损失函数。

多向量构造

在多分类问题中，我们可以使用多向量构造的方法。对于输入样本 (x) 和类别 (y)，特征函数 (\Psi(x, y)) 由 (k) 个维度为 (n) 的向量组成，除了第 (y) 个向量被设置为 (x) 外，其余向量均为零向量。权重向量 (w \in \mathbb{R}^{nk}) 可以看作是由 (k) 个权重向量 (w_1, \cdots, w_k \in \mathbb{R}^n) 组成。通过这种构造，我们有 (\langle w, \Psi(x, y) \rangle = \langle w_y, x \rangle)，因此多分类预测可以表示为 (h(x) = \arg\max_{y \in Y} \langle w_y, x \rangle)。

TF - IDF 特征函数

之前定义的 (\Psi(x, y)) 没有结合问题的先验知识。而 TF - IDF（词频 - 逆文档频率）特征函数则考虑了先验知识。假设 (X) 是文本文档集合，(Y) 是可能的主题集合，(d) 是词典的大小。对于词典中的每个词，其对应的索引为 (j)，(TF(j, x)) 表示该词在文档 (x) 中出现的次数，称为词频；(DF(j, y)) 表示该词在非主题 (y) 的训练文档中出现的次数，称为文档频率。TF - IDF 特

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。