筛状图
绘制两个属性的筛状图。
输入
• 数据:输入数据集
筛状图是一种用于可视化二维列联表中观测频率并与独立性假设下的期望频率进行比较的图形方法。该方法由 Riedwyl 和 Schüpbach 于 1983 年在一份技术报告中提出,后被称为“拼花图”(Riedwyl 和 Schipbach,1994)。在此图表中,每个矩形的面积与期望频率成正比,而观测频率通过矩形中的方格数量表示。观测频率与期望频率之间的差异(与标准皮尔逊残差成比例)通过阴影密度体现,蓝色表示正向偏差(观测值高于期望),红色表示负向偏差(观测值低于期望)。
- 选择属性:选择要在筛状图中展示的属性。
- 评分组合:通过评分功能寻找最优属性组合。
- 保存图像:将生成的图表保存为
.svg
或.png
格式。 - 生成报告:生成分析报告。
下图展示了泰坦尼克号数据集的筛状图,属性为“性别”和“是否幸存”(后者为该数据集的类别属性)。图表显示这两个变量高度相关,四个象限中观测频率与期望频率存在显著差异。例如,标注区域显示女性乘客的幸存率远高于预期(0.06 vs. 0.15)。