目录
词嵌入做为一种词向量模型,可以从文本中计算出隐含的上下文情景信息,态度及偏见。通过词向量距离的测算,就可以间接测得不同群体对某概念(组织、群体、品牌、地域等)的态度偏见。
偏见(刻板印象)的介绍有
大数据时代下社会科学研究方法的拓展——基于词嵌入技术的文本分析的应用
计算机科学家,正研究如何在AI中减弱甚至剔除刻板印象;但在社会科学领域,接受已有数据中存在的刻板印象,在数据中测量Bias,发现Bias,应用Bias,也能更好的认识和改造社会 。今天介绍一个挺好玩的工具WordBias。
五一工作坊感兴趣的童鞋可以关注一下,Python部分新增词嵌入&偏见挖掘
https://hidadeng.github.io/blog/2022-05-workshop/7-Python.html
WordBias
WordBias:一种用于发现词嵌入偏见(刻板印象)的交互式可视化工具, 旨在探索子群体(intersectional groups,直译为交叉群体)(如黑人女性、黑人穆斯林男性等)在词嵌入中的编码偏见。我们的工具认为一个词与一个交叉组相关联,例如“Christian Males”,如果它与它的每个构成子集(Christians 和 Males)密切相关。我们的工具旨在为专家提供有效的审核工具,为非专家提供教育工具,并增强领域专家的可访问性。
例如对“黑人男性”的刻板印象,是由“男人”和“黑人”两类刻板印象加上一些其他线索组成的。