1.2 数据标准化变换

本文介绍了数据标准化变换中的两种方法:离差标准化和标准差标准化。离差标准化通过将数据映射到[0,1]区间进行变换;标准差标准化则涉及数据的均值和标准差,其取值范围不限于[0,1],且可能出现负值。在MATLAB中,可以使用zscore和rscore函数进行这两种变换。" 81042832,7835117,Linux内核定时器:高精度与低精度实现解析,"['Linux内核开发', '定时器机制', '系统编程', '内核配置']

紧接上文
1.离差标准化:对原始数据的一种线性变换,将原始数据的数值映射到【0,1】区间,公式如下:
在这里插入图片描述
用x到最小值的距离除以最大值到最小值的距离,也可理解为最小值为起点,最大值为终点,各点到起点的距离占总路程的比率。
2.标准差标准化:相信大家在概率论与数理统计已经学过,这里我简单的说下
在这里插入图片描述

这种方法用的十分广泛,x杠(我不知道上划线咋搞,先这么叫吧)为原始数据均值,分母为原始数据的标准差。这种方法与上面不同,他的取值范围不仅限于[0,1]并且可能会出现负值。(在MATLAB中一般是按照列对矩阵进行处理)

调用格式:
Z = zscore(X)
[Z,mu,sigma] = zscore(X)
[…] = zscore(X,1)
[…] = zscore(X,flag,dim)

举例:

% 调用rand函数产生一个10行,4列的随机矩阵,每列是不同的分布
x = [rand(10,1), 5*rand(10,1), 10*rand(10
标准化是一种用于消除光谱数据中非目标因素影响的技术,广泛应用于光谱分析领域。该技术的核心目标是提升光谱数据的可比性和一致性,从而提高后续分析(如分类、定量分析等)的准确性。以下是关于谱标准化技术原理和应用场景的详细说明: 1. **技术原理** 谱标准化通常基于数学变换方法,旨在消除光谱数据中的系统性偏差,例如仪器响应差异、环境条件变化、样品制备不一致等。常见的方法包括: - **基线校正**:通过多项式拟合或迭代方法去除光谱基线漂移。 - **归一化**:将光谱数据缩放到特定范围(如0到1),常见的方法包括最小-最大归一化和Z-score标准化。 - **多元散射校正(MSC)**:用于消除散射效应的影响,适用于近红外光谱数据。 - **标准正态变量变换(SNV)**:对每个样本的光谱进行均值中心化和标准差归一化,适用于消除颗粒度和表面反射的影响。 2. **应用场景** 谱标准化技术广泛应用于多个领域,包括但不限于: - **农业与食品检测**:例如通过近红外光谱分析农产品成分时,消除样品颗粒度和湿度差异的影响。 - **环境监测**:在大气或水质光谱检测中,减少仪器漂移或温度变化对测量结果的影响。 - **医学诊断**:在生物组织光谱分析中,提高不同时间或设备采集数据的一致性。 - **材料科学**:在材料成分分析中,确保不同批次或仪器数据的可比性。 3. **实施步骤** 实施谱标准化通常包括以下步骤: - 数据采集:获取原始光谱数据。 - 预处理:去除噪声、平滑数据。 - 标准化方法选择与应用:根据数据特性和需求选择合适的标准化方法。 - 验证:通过交叉验证或外部验证评估标准化效果。 4. **示例代码** 以下是一个使用Python实现SNV(标准正态变量变换)的示例代码: ```python import numpy as np def snv(data): # data: 二维数组,行表示样本,列表示波长点 mean = np.mean(data, axis=1, keepdims=True) std = np.std(data, axis=1, keepdims=True) return (data - mean) / std # 示例数据 spectra_data = np.array([[1.2, 1.5, 1.8], [2.0, 2.4, 2.9], [3.1, 3.3, 3.6]]) snv_data = snv(spectra_data) print(snv_data) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值