机器学习中的无监督学习、强化学习与伦理考量
1. 无监督学习概述
无监督学习是指在没有相应输出标签的情况下,从输入数据构建模型的过程。由于没有输出标签,也就不存在“监督”。其目标并非学习从输入到输出的映射,而是描述或理解数据的结构。数据可能具有不同的特征,如离散或连续、低维或高维、定长或变长。
在一些任务中,如英文文本翻译成法文、根据描述文本生成匹配图像等,虽然原则上可以在标准监督学习框架下处理,但难度较大。原因有二:一是输出可能存在歧义,例如英文句子到法文有多种有效翻译,描述文本也可对应多张匹配图像;二是输出具有相当的结构,并非所有单词串都能构成有效的英文或法语文句,也并非所有RGB值组合都能形成合理的图像。不过,这种“语法”可以在无需输出标签的情况下学习,例如通过学习大量文本数据的统计信息来掌握如何构成有效的英文句子。
2. 生成模型
生成式无监督模型致力于学习合成与训练数据在统计上难以区分的新数据示例。部分生成模型会明确描述输入数据的概率分布,并通过从该分布中采样生成新示例;另一些则仅学习生成新示例的机制,而不明确描述其分布。
先进的生成模型能够合成极为合理但与训练示例不同的示例,在图像和文本生成方面尤为成功。它们还能在部分输出预先确定的约束下合成数据,即条件生成,如图像修复和文本补全。现代文本生成模型功能强大,看似具有智能,能根据给定文本和问题生成最可能的答案,但实际上它们仅了解语言的统计信息,并不理解答案的含义。
以下是生成模型的应用示例:
|应用场景|描述|
| ---- | ---- |
|图像生成|基于训练的猫或建筑物图片模型生成对应图像|
|文本合成|合成遵循
超级会员免费看
订阅专栏 解锁全文
1258

被折叠的 条评论
为什么被折叠?



