人工智能、行业趋势与相关技术驱动力解析
1. AI、机器学习与深度学习
人工智能(AI)、机器学习和深度学习这几个领域在出版物中常被分开讨论,但它们背后有许多共同的技术和架构,比如神经网络和深度学习。区分这三个领域,从输入和输出的角度入手相对容易,而非依据实际使用的算法和技术。
例如,深度神经网络可用于上述三种学习类型,但监督学习的输入是带标签的样本,而深度强化学习则假设会从环境中(至少周期性地)接收奖励信号。不过,仅从输入 - 输出的角度看待问题可能过于简单,这也暴露出仅从三个维度考虑机器学习的不足。
机器学习领域有许多关于半监督学习的研究,在半监督学习中,训练数据中带标签的部分比纯监督学习要少得多。另一个被广泛探索的例子是主动学习。假设在对推特账户进行分类(区分人为控制还是机器人控制)时,只有一部分账户的控制情况是已知的(即带标签),其余未知。若采用纯监督学习的方法,在较小的训练集上训练分类器,再应用到较大的无标签测试集上,可能会因训练集过小而导致性能不佳。更好的选择是,先用现有训练集训练初始模型,然后通过选择有潜力的无标签样本进行手动标注,逐步扩大训练集。主动学习的前提是选择当前分类器最不确定的样本进行标注,因为这些样本有望提升分类器的性能。
更高级的“低监督”机器学习变体包括零样本学习,即测试集中的标签类别可能来自未知集合。尽管初始训练集可能很大,但训练集中的标签来自一个集合,而测试集中可能包含训练时从未见过的类别样本。例如,计算机视觉分类器可能经过训练以识别豹子和狮子,但测试集中还引入了老虎的图像。这就是“零样本”问题,因为系统需要识别(至少检测到)之前未遇到过的类别,这在统计学上是一个具有挑战性的问题。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



