主成分分析(PCA)在图像数据处理中的应用
1. 机器学习中k值的选择
在机器学习里,字母k被用于众多不同的算法,这可能会造成混淆。所以,当看到与k相关的内容时,关注上下文至关重要。
在数据压缩方面,压缩程度很关键。压缩不足会使训练和评估步骤效率低下;而过度压缩则可能会丢失重要信息。为了选取超参数k的最佳值,通常会尝试几个不同的值,观察其效果,然后选择表现最优的那个。许多库提供了超参数搜索技术,可实现这一搜索过程的自动化。
需要注意的是,无论使用何种PCA变换来压缩训练数据,对于未来的所有数据都必须以相同的方式应用这些变换。
2. PCA在简单图像上的应用
2.1 简单图像的表示
假设有一组由六个灰度图像组成的集合,每个图像边长为1000像素,即每个图像包含1000×1000 = 100万个像素。我们能否找到比用一百万个数字来表示每个图像更好的方法呢?
实际上,这六个图像中的每一个都可以由另外三个图像按不同比例缩放后相加得到。例如,第一个图像可以通过添加20%的圆形、70%的垂直矩形和40%的水平矩形来重建。这些缩放因子被称为权重,六个起始图像对应的权重如下表所示:
| 图像序号 | 圆形权重 | 垂直矩形权重 | 水平矩形权重 |
| ---- | ---- | ---- | ---- |
| 1 | 0.2 | 0.7 | 0.4 |
| 2 | 0.8 | 0.3 | 0.6 |
| 3 | 0.5 | 0.3 | 0.3 |
| 4 | 0.3 | 0.5 | 0.9 |
| 5 | 0.4 | 0.7 | 0.7
超级会员免费看
订阅专栏 解锁全文
612

被折叠的 条评论
为什么被折叠?



