多分类、结构化输出预测与排序:原理、方法与应用
在机器学习领域,多分类、结构化输出预测和排序是几个重要且具有挑战性的任务。下面将详细介绍这些任务的相关原理、方法以及如何应对其中的挑战。
多分类预测
多分类预测旨在将输入样本分配到多个类别中的一个。为了实现这一目标,我们需要定义合适的特征函数和损失函数。
多向量构造
在多分类问题中,我们可以使用多向量构造的方法。对于输入样本 (x) 和类别 (y),特征函数 (\Psi(x, y)) 由 (k) 个维度为 (n) 的向量组成,除了第 (y) 个向量被设置为 (x) 外,其余向量均为零向量。权重向量 (w \in \mathbb{R}^{nk}) 可以看作是由 (k) 个权重向量 (w_1, \cdots, w_k \in \mathbb{R}^n) 组成。通过这种构造,我们有 (\langle w, \Psi(x, y) \rangle = \langle w_y, x \rangle),因此多分类预测可以表示为 (h(x) = \arg\max_{y \in Y} \langle w_y, x \rangle)。
TF - IDF 特征函数
之前定义的 (\Psi(x, y)) 没有结合问题的先验知识。而 TF - IDF(词频 - 逆文档频率)特征函数则考虑了先验知识。假设 (X) 是文本文档集合,(Y) 是可能的主题集合,(d) 是词典的大小。对于词典中的每个词,其对应的索引为 (j),(TF(j, x)) 表示该词在文档 (x) 中出现的次数,称为词频;(DF(j, y)) 表示该词在非主题 (y) 的训练文档中出现的次数,称为文档频率。TF - IDF 特
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



