最近有很多私信要求出一期用于PPT汇报或者日常展示的内容,这篇我们不做训练、不做分类,用 t-SNE 3D 把 KSC 的标注像素降到 3 维,并导出自动旋转的 GIF,适合教学、汇报或文章配图。
一、数据与结果预览
-
数据:
KSC.mat与KSC_gt.mat(0 为未标注,>0 为类别) -
输出:
-
PNG:
tSNE3_Labeled_cover.png

-
GIF:
tSNE3_Labeled_rotate.gif
见保存文(太大无法上传)
-
-
只对有标签的像素做降维与上色(颜色=真实类别),图像不做训练。
二、运行环境
-
Python ≥ 3.8
-
必需库:
numpy、scipy、scikit-learn、matplotlib、pillow -
安装(示例):
pip install numpy scipy scikit-learn matplotlib pillow
三、代码结构鸟瞰
-
路径与可视化参数:数据位置、导出目录、t-SNE/动画参数
-
工具函数:
load_hsi:自动识别.mat主键、读入数据make_class_cmap:生成足够多、区分度高的离散类别色表
-
main 主流程:
- 读取与筛选有标注像素
- 标准化 + PCA 预降维(加速/去噪)
- 子采样(避免 t-SNE 爆内存/过慢)
- 自适应
perplexity(满足 t-SNE 约束) - t-SNE 3D 拟合
- Matplotlib 3D 点云绘制(按类上色)
- FuncAnimation 旋转相机并用 PillowWriter 导出 GIF
下面按模块逐段拆解要点与为什么这么写。
四、逐段解析与“为什么”
1)全局参数与样式
DATA_DIR = r"...\DATASETS"
X_FILE = "KSC.mat"
Y_FILE = "KSC_gt.mat"
OUT_DIR = os.path.join(DATA_DIR, "VIS3D_tSNE_GIF")
PNG_PATH = os.path.join(OUT_DIR, "tSNE3_Labeled_cover.png")
GIF_PATH = os.path.join(OUT_DIR, "tSNE3_Labeled_rotate.gif")
SEED = 42
PCA_FOR_TSNE = 30 # t-SNE 前置 PCA 维度
TSNE_SUBSAMPLE = 20000 # t-SNE 点数上限(仅标注像素)
TSNE_ITER = 1000
NUM_FRAMES = 120 # 动画帧数
FPS = 20 # 帧率
ELEV = 20 # 俯仰角
AZIM_START = -60 # 起始方位角
AZIM_SWEEP = 360 # 旋转总角度
- PCA_FOR_TSNE:t-SNE 前用 PCA 降到 30 维,常见做法,减噪且加速(高光谱往往 >100 维,无用噪声多)。
- TSNE_SUBSAMPLE:上限 2 万点。t-SNE 的复杂度高,子采样能把时间和内存控制住,还能保持结构观感。
- 动画参数:
NUM_FRAMES × (1/FPS)≈ 动画时长(此处 120 帧 @20fps 约 6 秒)。 - Matplotlib 字体设为中文(SimHei);如报字体警告可移除,不影响功能。
2)读取 .mat:键名自动识别
def load_hsi(x_path, y_path):
Xm = sio.loadmat(x_path)
Ym = sio.loadmat(y_path)
x_key = [k for k in Xm if not k.startswith("__")][0]
y_key = [k for k in Ym if not k.startswith("__")][0]
return Xm[x_key], Ym[y_key]
- 许多
.mat文件的主键并非固定(可能叫KSC、indian_pines_corrected等),用“不是__开头”的第一个键作为主键,免手改。
3)类别色表:够多、够分散
def make_class_cmap(n_cls):
base = []
for name in ["tab20", "tab20b", "tab20c"]:
base.append(matplotlib.colormaps[name].colors)
colors = np.vstack(base)
if n_cls > len(colors):
rep = int(np.ceil(n_cls / len(colors)))
colors = np.tile(colors, (rep, 1))
return ListedColormap(colors[:n_cls])
- 组合
tab20、tab20b、tab20c这三套 20 色,共 60 色。KSC 的类别数远小于 60,一般足够且区分度高。 - 类别多时自动重复,但高光谱场景里基本用不到这一步。
4)主流程:从读数据到导出 GIF
(a) 只取有标注像素
X, Y = load_hsi(...)
X_flat = X.reshape(-1, B)
y_flat = Y.reshape(-1)

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



