人工智能中的数据与算法:挑战与机遇
1. 数据中的五种误判
1.1 视角误判
视角误判意味着AI往往只能获取平均情况,而难以触及事件的真实全貌。例如,无论有多少证人描述一个事件,所能得到的也仅仅是对真相的近似,而非真相本身。以1927年一位失聪者的经历为例,当时剧院升级引入有声电影,对于大多数人来说这是进步,而失聪者却因此感觉自己被边缘化,在他们眼中,升级是坏事而非好事。这表明普遍认为的真实并非对每个人都适用,普遍真理只是一个不存在的神话。
1.2 偏见误判
偏见误判是指有人虽能看到真相,但因个人顾虑或信仰而无法真正察觉。比如司机在思考事故时,可能过于关注道路中间,导致路边的鹿变得“隐形”,当鹿突然冲到路中间时,司机来不及反应。然而,判断司机没看到鹿的原因很复杂,可能是鹿被灌木丛遮挡,也可能是司机注意力不集中或一时分心。确认偏见来源在创建避免偏见的算法时非常重要。理论上可以避免偏见误判,但实际上人类都有各种偏见,这些偏见会导致数据集出现偏差。人类依靠过滤器避免信息过载,但这些过滤器也是偏见的来源,因为它们阻碍人们真正看到事物。
1.3 参考框架误判
参考框架误判不一定是错误导致的,而是源于理解问题。当一方描述事件,而另一方缺乏相关经验时,细节就会变得模糊或被完全误解。例如经典喜剧《谁在一垒》就利用了参考框架错误。再如,水手经历海上风暴,即便通过视频、访谈和模拟器,没有亲身经历过这种风暴的人也难以体会其感受。避免参考框架误判的最佳方法是让各方形成相似的参考框架,即拥有相似的经验知识。但对于静态数据集,当潜在查看者缺乏所需经验知识时,参考框架错误仍会发生。AI由于缺乏创造经验的能力,总会遇到参考框架问题。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



