弹性评估与安全融合:数据探索与安全思考
1. 探索性数据分析工作流程
在进行探索性数据分析(EDA)时,我们遵循特定的结构。流程并非预先规划好的,而是在过程中记录并最终重新组装而成。整个过程中,我们选用了Mondrian作为EDA工具,它完全由鼠标交互驱动,无需脚本编写,能实现快速的数据探索。
| 高目标流程 | 通用EDA方法 | 具体表现 | 主要发现 |
|---|---|---|---|
| 未详细提及 | 未详细提及 | 未详细提及 | EDA发现1、2、4.1和5在原工作中未被发现 |
部分图形为了提高可读性和质量,使用R语言的静态可视化包ggplot2进行了重构,与原始图形仅存在美学上的差异。
2. 基础数据特征分析
通过边际分布发现,我们可以对单个变量的特征有初步了解,比如是否包含缺失值、变量遵循何种分布以及四分位数的值等。这一步对于理解和验证数据至关重要,能帮助我们发现属性记录值与理论域之间的不一致。我们就发现了一些小错误并反馈给了相关人员。
3. 基础定性抽象
在弹性评估中,边际分布分析的另一个目标是对“目标”变量(这里是RT)进行初步的定性离散化。RT的箱线图显示存在显著的离群值,有些甚至超过50秒,这使得非离群值在视觉上被抑制。我们对箱线图进行缩放,移除超过20秒的点(19个
超级会员免费看
订阅专栏 解锁全文
669

被折叠的 条评论
为什么被折叠?



