在变量较多的情况下,直接绘制所有变量的散点图会非常混乱。我们可以采用以下几种策略来可视化这些数据:
---
## ✅ 一、绘制单变量与响应变量(LWAGE)之间的散点图
如果你想观察每个变量与工资对数(`LWAGE`)的关系,可以分别绘制每个变量与 `LWAGE` 的散点图。
### MATLAB 示例代码:
```matlab
% 假设 data 是你的数据表,包含 LWAGE 和其他变量
variables = {'EXP', 'WKS', 'OCC', 'IND', 'SOUTH', 'SMSA', 'MS', 'FEM', 'UNION', 'ED', 'BLK'};
nVars = length(variables);
figure;
for i = 1:nVars
subplot(ceil(nVars/3), 3, i); % 3列布局
scatter(data.(variables{i}), data.LWAGE, 'filled');
title(['LWAGE vs ', variables{i}]);
xlabel(variables{i});
ylabel('LWAGE');
grid on;
end
```
> 这段代码会生成一个包含多个子图的图表,每个子图显示一个变量与 `LWAGE` 的关系。
---
## ✅ 二、使用配对图(Pair Plot)查看变量间关系
当变量较多时,可以使用 `gplotmatrix` 函数绘制变量之间的配对图(Pair Plot),但注意变量太多会导致图太多,建议只选几个关键变量。
### MATLAB 示例代码:
```matlab
% 选择你感兴趣的变量
selectedVars = {'EXP', 'ED', 'WKS', 'UNION', 'SMSA', 'FEM', 'LWAGE'};
selectedData = table2array(data(:, selectedVars));
figure;
gplotmatrix(selectedData, [], [], [], '', 'on');
title('Pairwise Scatter Plots of Selected Variables');
```
---
## ✅ 三、使用热力图(Heatmap)查看变量相关性(更简洁)
如果你只是想了解变量之间的相关性,可以用热力图展示各变量与 `LWAGE` 的相关系数。
### MATLAB 示例代码:
```matlab
% 计算相关系数矩阵
corrMat = corr(table2array(data(:, {'EXP', 'WKS', 'OCC', 'IND', 'SOUTH', ...
'SMSA', 'MS', 'FEM', 'UNION', 'ED', 'BLK', 'LWAGE'}))');
% 只显示 LWAGE 与其他变量的相关性
lwageCorr = corrMat(end, 1:end-1)';
varNames = {'EXP', 'WKS', 'OCC', 'IND', 'SOUTH', 'SMSA', 'MS', 'FEM', 'UNION', 'ED', 'BLK'};
% 绘制条形图
figure;
bar(lwageCorr);
set(gca, 'XTickLabel', varNames);
title('Correlation of LWAGE with Each Predictor');
ylabel('Correlation Coefficient');
grid on;
```
---
## ✅ 四、使用降维方法(如 PCA)可视化高维数据
如果变量太多,可以使用主成分分析(PCA)将数据降维到二维或三维,然后可视化。
### MATLAB 示例代码:
```matlab
X = table2array(data(:, {'EXP', 'WKS', 'OCC', 'IND', 'SOUTH', 'SMSA', 'MS', ...
'FEM', 'UNION', 'ED', 'BLK'}));
[coeff, score, latent, tsquared, explained] = pca(X);
% 绘制前两个主成分与 LWAGE 的关系
figure;
scatter(score(:,1), score(:,2), 10, data.LWAGE, 'filled');
colorbar;
title('PCA Projection (PC1 vs PC2), Colored by LWAGE');
xlabel('Principal Component 1');
ylabel('Principal Component 2');
```
---
## ✅ 五、使用交互式可视化工具(推荐)
MATLAB 提供了 `plotmatrix` 和 `scatter plot matrix` 插件,也可以使用 `uitable` + `plot` 的方式交互选择变量。
---
## ✅ 总结建议
| 目标 | 推荐方法 |
|------|-----------|
| 查看单变量与 LWAGE 的关系 | 单变量散点图 |
| 看多个变量之间的两两关系 | 配对图(Pair Plot) |
| 快速找出与 LWAGE 关系最强的变量 | 相关系数热力图 |
| 可视化高维数据分布 | PCA 降维图 |
| 交互式探索 | 使用 GUI 或 `uitable` + `plot` |
---
###