数据可视化与降维方法全解析
1. 双变量数据的分析与可视化
在处理双变量数据时,我们主要关注两个通用变量 (X_1) 和 (X_2) 之间的关系总结与可视化。根据变量类型的不同,有不同的处理方式。
- 当两个变量均为分类或离散变量时 :可以使用双向列联表展示每个观测值 ((x_1, x_2)) 的频率。这种信息可以通过并排条形图、分组条形图或堆叠条形图进行可视化。例如,在分析数据集中神经元的树突 Sholl 节数量((X_{56}))与神经元类别(Class)的关系时,双向列联表列出了不同树突 Sholl 节数量下中间神经元(I)和锥体神经元(P)的数量。并排条形图则直观地展示了不同神经元类别在各树突 Sholl 节数量下的分布差异,中间神经元的分布更靠左,呈右偏态,而锥体神经元则表现出双峰性。
| (X_{56}) | Class | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 26 |
| — | — | — | — | — | — | — | — | — | — | — | — | — | — | — | — | — | — | — | — | — | — | — |
| | I | 1 | 11 | 17 | 38 | 39 | 39 | 26 | 12 | 5 | 3 | 2 | 1 | 4 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 |
| | P | 0 | 1 | 4 | 5 | 10 | 12 | 10 | 5 | 5 | 4 | 11 | 13 | 12 |
数据可视化与降维全解
超级会员免费看
订阅专栏 解锁全文
1143

被折叠的 条评论
为什么被折叠?



