利用人工智能打击领英上的性骚扰:研究与启示
1. 人工智能在领英反网络霸凌中的应用潜力
在数字媒体环境下,借助人工智能来打击网络霸凌至关重要。对于领英这样的社交平台而言,需优化工具以预防或迅速制止骚扰行为。同时,要开发更出色的人工智能模型,减少对受害者举报的依赖,并降低误判率。
此前关于领英与人工智能的研究较少。例如,有观点指出机器学习和人工智能能提升领英的搜索能力,这对于准确识别和分类有害内容十分关键。领英可运用人工智能算法自动检测并标记潜在有害的帖子和评论,供管理员审核或直接删除。还有研究探讨了领英如何利用机器学习为用户推荐工作,这种方法也可用于识别并向管理员推荐潜在的违规内容,进而采取相应措施。此外,领英利用 Hadoop 处理大量数据用于推荐系统,同样可用于分析用户行为和交互数据,识别网络霸凌模式,并为受骚扰用户制定个性化的预防策略。
2. 研究方法
本次研究旨在通过定量研究方法,确定领英性骚扰者的共同特征,助力人工智能专家开发或优化能有效应对领英平台性骚扰的人工智能模型。
-
数据收集
:采用问卷收集数据,问卷分为四个部分:
1.
受访者的人口统计学特征
:涵盖年龄、性别和所在大洲,有助于了解不同人群中领英性骚扰的范围和普遍性。
2.
骚扰者的信息
:包括估计年龄、性别、位置、资料类型(真实或虚假),以及是否为招聘人员,这些信息对识别骚扰者的共同特征和了解其与受害者的关联很重要。
3.
性骚扰事件的具体特征
:如观察到的行为类型、使用的操纵策略,以及是否升级或索要个人信息,用于识别骚扰者行为的模式和趋势。
4.
受害者的反应
:如是否回应、屏蔽骚扰者以及是否向领英举报,有助于了解当前举报和预防机制的有效性以及事件对受害者的情感影响。
-
参与者和样本大小
:采用便利抽样的非概率抽样技术,随机在群组和私信中发送问卷。通过两个筛选问题,仅将同时回答是领英用户且经历过性骚扰的人纳入样本。共 723 名领英用户完成问卷,其中 479 人确认经历过性骚扰。尽管样本量相对较小,但在性骚扰等敏感话题的研究中较为常见,且针对性抽样使样本更具相关性。
-
数据分析
:使用社会科学统计软件包(SPSS)的描述性统计方法分析问卷数据,包括频率分布、百分比、均值和标准差,以识别回答中的模式和趋势。此外,还使用推断统计来检查变量之间的关系和组间差异。
3. 研究结果
-
受访者(受害者)的人口统计学特征
| 特征 | 详情 |
| ---- | ---- |
| 性别 | 女性占比 95.8%,男性占比 4.2%,表明女性更易遭受骚扰和歧视,更可能参与此类调查。 |
| 年龄 | 17 - 31 岁的年轻人占比超过 80%,反映出年轻人更容易受到骚扰,可能是因为他们接触新社交环境,且应对能力较弱。 |
| 位置 | 大多数受访者来自非洲(41.8%),其次是欧洲(30.3%)、北美(13.8%)、亚洲(9%)、南美(4.6%)和澳大利亚(0.6%)。 | -
领英性骚扰者的人口统计学特征
| 特征 | 详情 |
| ---- | ---- |
| 性别 | 449 名骚扰者为男性,占比 93.73%;30 名骚扰者为女性,占比 6.27%。同性性骚扰案例较少。 |
| 位置 | 65.1% 的骚扰者与受害者来自同一国家,表明部分骚扰者倾向于选择同地区的受害者,可能寻求现实联系。 |
| 年龄 | 近一半骚扰者年龄大于受害者,体现出权力动态和潜在的操纵剥削;也有部分骚扰者年龄小于受害者。 |
| 资料类型 | 近一半骚扰者使用真实领英资料,约四分之一使用虚假资料,27.3% 未核实。超过 70% 的女性骚扰者资料为虚假。 |
| 现实关系 | 92.7% 的骚扰者与受害者无现实联系,但仍有 7.3% 存在现实关系,说明即使是熟人也可能在网上越界。 |
| 是否为招聘人员 | 16.5% 的骚扰者是招聘人员,这反映出职业环境中尤其是招聘过程中性骚扰的普遍性,受害者可能因招聘人员的权力地位而感到无力。 |
| 骚扰开始时间 | 63.5% 的骚扰发生在最初的消息交流中,表明初始对话是检测和预防骚扰的关键时机,人工智能模型可针对此进行训练。 | -
领英性骚扰经历的特征
- 骚扰类型 :479 名受害者中,最常见的骚扰形式是不必要的性关注(19.2%),其次是跟踪(18.8%)和性胁迫(18.4%),还有其他形式如辱骂、低俗笑话、侮辱和威胁等。
- 操纵策略 :48% 的骚扰案例中,骚扰者使用了操纵策略,表明相当一部分骚扰者会采用操纵手段迫使受害者屈服或建立主导地位。
- 攻击语气 :44.1% 的骚扰消息使用了攻击语气,说明许多骚扰者通过恐吓手段控制受害者。
- 索要个人信息 :63.9% 的骚扰者试图收集受害者的个人信息。
- 情绪语气 :骚扰者的情绪语气多样,其中自信语气最为常见(37.6%),其次是犹豫(20.5%)、愤怒(18.8%)和开心(17.3%)。
-
受害者对骚扰的反应
| 反应 | 详情 |
| ---- | ---- |
| 是否回应 | 52.8% 的受害者回应了骚扰消息,47.2% 未回应。 |
| 是否屏蔽 | 69.3% 的受害者屏蔽了骚扰者。 |
| 是否举报 | 48.4% 的受害者向领英举报了骚扰者。不同年龄和地区的举报比例有所差异,无论年龄大小,约一半受害者会举报;非洲受害者举报比例较低(33%),欧洲较高(66%)。 |
| 不同骚扰形式的举报比例 | 侮辱的举报比例最高(74%),其次是威胁(72%)、性胁迫(48%)和不必要的性关注(51%),跟踪的举报比例最低(44%)。 |
以下是研究过程的 mermaid 流程图:
graph LR
A[确定研究目标] --> B[设计问卷]
B --> C[数据收集]
C --> D[数据分析]
D --> E[得出结果]
E --> F[讨论与应用]
4. 研究讨论
4.1 研究结果对自然语言处理(NLP)打击性骚扰的启示
本研究为领英平台上性骚扰的检测提供了新的见解,在以往相关研究的基础上有所拓展。研究发现了一些特定的语言模式,例如使用攻击性语言、露骨的性评论和人身攻击等,这些都是领英上性骚扰的有力预测指标。同时,研究还强调了其他关键因素,包括目标和骚扰者的性别、目标的职业资历水平、骚扰消息的频率和持续时间,以及施害者与受害者之间的权力不平衡。
这些新因素对于开发更有效的人工智能模型具有重要意义,它们可以作为特征用于训练模型,以识别和标记领英平台上的性骚扰实例。通过将这些特征纳入自然语言处理模型,人工智能专家能够提高模型在识别和预防领英性骚扰方面的准确性和有效性。
此外,研究还强调了上下文在识别领英上性骚扰实例中的重要性。某些类型的语言或行为在某些上下文中可能是可以接受的,但在其他上下文中可能是不适当的或构成骚扰。因此,在开发自然语言处理模型时,必须考虑通信发生的更广泛背景。将这些上下文因素纳入模型,可以进一步提高模型在识别和预防性骚扰方面的准确性和有效性,有助于打造一个更安全、更尊重他人的在线社区。
以下是这些关键因素对自然语言处理模型开发的影响表格:
| 关键因素 | 对自然语言处理模型开发的影响 |
| ---- | ---- |
| 特定语言模式 | 作为特征训练模型,提高识别准确性 |
| 性别因素 | 考虑不同性别组合下的骚扰模式,增强模型适应性 |
| 职业资历水平 | 结合职业场景,更精准判断骚扰行为 |
| 消息频率和持续时间 | 分析行为规律,及时发现潜在骚扰 |
| 权力不平衡 | 关注权力关系,识别因权力产生的骚扰 |
| 上下文因素 | 使模型考虑语境,减少误判 |
4.2 研究的局限性
需要注意的是,本研究采用的便利抽样方法存在一定局限性,它可能无法代表整个领英用户群体。因此,研究结果不能推广到所有领英用户。然而,对于本研究旨在通过直接经历过领英性骚扰的用户数据来识别常见特征的目标而言,便利抽样方法是合适的。
为了更直观地展示研究过程和结果的应用关系,下面给出一个 mermaid 流程图:
graph LR
A[研究结果:特定语言模式等因素] --> B[纳入自然语言处理模型]
B --> C[提高模型准确性和有效性]
C --> D[更好识别和预防领英性骚扰]
E[研究局限性:便利抽样不具普遍性] --> F[提醒结果应用范围]
F --> G[后续研究需改进抽样方法]
综上所述,本研究为利用人工智能打击领英上的性骚扰提供了有价值的信息和方向。虽然存在一定局限性,但通过明确性骚扰者的特征和骚扰行为的模式,为开发更强大的自然语言处理模型提供了基础,有望为领英用户创造一个更安全、更友好的社交环境。同时,未来的研究可以进一步改进抽样方法,以获得更具代表性的结果,从而更好地应对领英平台上的性骚扰问题。
超级会员免费看

被折叠的 条评论
为什么被折叠?



