模式识别:从字母分类到社会秩序的技术与思考
1. 关键认知价值与背景
在探讨模式识别相关内容时,有两个关键的认知价值值得关注。以 Perspective 的“毒性”分类器为例,它要发挥作用,首先需要能够识别上下文的重要性,即相同的数据(如单词、n - 元组)在不同的上下文(如不同的在线平台、不同的身份)中可能会产生不同的效果(如一个人离开或留在对话中)。其次,为了在遇到新形式的有毒言论时仍能发挥作用,分类器需要具备上下文鲁棒性,也就是说,从过去的数据(如训练语料库)中得出的决策或类别(如“有毒”言论)对于未来尚未见过的数据仍然是正确的。
2. 模式识别成为工程分支的历程
1955 年,Oliver Selfridge 在西部联合计算机会议的“学习机器”会议上提出,“模式识别”是指从无关细节的背景中提取重要特征,由一台通过构建与特定任务中先前有效的数学运算序列“相似”但不完全相同的序列来“学习”的机器完成。当时会议主席 Willis Ware 指出,“学习机器”周围存在“巨型大脑”的炒作,并且这些程序所谓的“思考”程度仅限于用户和设计者能够深入探究问题,从而考虑到所有可能出现的情况。
Selfridge 的合作者 Gerald Paul Dinneen 认为,当时的开放性研究问题是设计一台能够识别模式的机器。任何可能的视觉图像,无论多么杂乱或模糊,都被称为一种配置,而模式是一个等价类,由所有在机器中产生相同输出的配置组成。
Selfridge 和 Dinneen 选择识别纸上印刷的黑色“A”和“O”作为研究对象,因为“A”具有不对称性,“O”具有对称性,他们认为直线识别任务“太简单”,面部识别“太复杂”。他们的目标不是构建高效的阅读机器,
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



