数据挖掘聚类在网络欺凌研究及无线覆盖预测中的应用
数据挖掘聚类在网络欺凌研究中的应用
数据收集
数据收集通过一份分为两部分的问卷进行。第一部分收集参与者的社会人口统计信息,如地理位置、家庭和学生信息以及心理健康水平;第二部分包含了青少年通过手机和互联网遭受侵害的CYBVIC量表。该量表由18个项目组成,通过1 - 4的响应范围(从不、有时、多次、总是)来衡量虐待行为。其中,通过移动设备遭受侵害通过8个项目衡量,评估涉及攻击、侵犯隐私、诋毁和社会排斥的行为;通过互联网遭受侵害则在上述8个项目基础上增加了两个与身份盗窃相关的项目。该量表在西班牙和墨西哥构建并验证,具有适当的内部一致性和心理测量特性。样本为厄瓜多尔的大学生。
数据预处理
- 剔除无效问卷 :为获得最佳结果,首先丢弃没有任何响应的空调查。
- 选择属性 :选择CYBVIC量表中与移动设备受害情况对应的项目,因为移动技术能更快访问互联网和通信系统,为攻击者更容易接触受害者提供了额外途径。同时,纳入问卷社会人口统计部分中范围为1 - 10(1为优秀,10为糟糕)的心理健康量表,因为网络欺凌会对年轻人的心理健康产生负面影响。
- 处理顺序数据 :由于网络欺凌调查属于顺序类型,为避免将其视为分类数据而导致信息大量丢失和结果错误,本研究仅考虑CYBVIC量表中1 - 4的数值以及心理健康量表中1 - 10的数值。
- 数据标准化 :在应用分组算法之前,必须对数据进行标准化以避免结果偏差
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



