- 博客(15)
- 收藏
- 关注
原创 如何优雅地绘制相关性热图
摘要 本文介绍了一款功能强大的相关性分析工具,可帮助研究人员高效完成特征筛选和可视化分析。该工具支持皮尔逊和斯皮尔曼两种相关系数计算,提供椭圆、方形、圆形等5种专业可视化样式,并能自动生成详细统计报告。其特色功能包括:支持Excel三表数据导入,可自定义相关性阈值和图形参数,支持PNG/FIG格式导出。
2025-08-28 23:23:15
1007
原创 特征相关性分析和提取工具
今天为大家介绍一款专业的**相关性特征提取工具**,它能够智能筛选与目标变量高度相关的特征,为您的数据分析提供强有力的支持!**文件名格式**: `特征筛选结果_方法_时间戳.xlsx`**文件名格式**: `特征筛选可视化_方法_时间戳.png`- **📊 Pearson相关系数**: 适用于线性关系分析。- **📖 数据格式要求**: 详细说明输入数据的格式规范。- **专业输出**:导出筛选后的特征数据和详细分析报告。- **工作原理**:保留绝对相关系数大于设定阈值的特征。
2025-08-27 19:22:31
1092
原创 模型建模效果提升—PLSR调优助手
摘要:PLSR调优助手是一款专为偏最小二乘回归模型开发的参数优化工具,能够自动寻找最优参数并生成MATLAB代码。该软件支持多种评价指标计算(R²、RMSE、RPD等),提供图形化界面操作,适用于数据质量受限情况下的建模优化。用户需准备符合格式要求的光谱数据和预测指标文件,设置调优次数、R²阈值等参数后即可开始优化。软件可自动导出包含最优模型代码的.m文件,并给出详细的结果解读和优化建议。适用于Windows系统(需MATLAB2020以上版本),特别适合在数据质量不理想时通过优化样本划分和模型参数提升回归
2025-07-20 23:05:43
1602
原创 利用Python快速进行光谱反射率标定和提取
🔥Python光谱分析神器!告别ENVI繁琐操作,3步搞定反射率标定:1️⃣原始数据+2️⃣白参考+3️⃣黑参考=✅一键标定!✨特色功能:📌交互式ROI选取(矩形/圆形)📌批量处理📌自动保存数据/图片⚡比ENVI快N倍!适用场景:🏷️高光谱影像处理🏷️实验室快速分析🏷️建模数据提取💻支持定制代码,处理效率翻倍!从此光谱分析So easy~
2025-07-17 17:29:16
762
原创 光谱样本数据集划分方法-Python版本
本文介绍了光谱数据样本划分方法Python版本。使用玉米光谱数据示例,通过修改dataset_split_main代码中的文件路径和参数设置,可以处理自定义数据。程序支持读取光谱数据、理化值和波长数据,并提供五种数据集划分方法:浓度梯度划分、Kennard-Stone方法、随机划分法、Duplex方法和SPXY方法。输出结果包含数据分布图、划分结果分析和含量分析汇总,图表采用中文宋体和英文Times New Roman字体格式。用户可根据目标变量选择不同划分方法
2025-07-14 01:45:06
277
原创 光谱预处理方法-Python版本
本文介绍了Python版本的适用于光谱数据分析的预处理方法。程序使用说明包括:1)修改数据路径和表格名称来读取光谱数据、化学值和波长数据;2)选择目标分析变量(含水率、含油率、蛋白质或淀粉);3)具体原理可参考提供的优快云博客链接。示例数据采用玉米光谱数据,包含四个化学含量指标,用户需根据实际需求调整代码中的目标变量target_var参数。该工具可实现光谱数据的批量处理和分析。
2025-07-14 01:38:48
659
原创 Python Matplotlib中文宋体+英文Times New Roman方法
本文介绍了将Times New Roman和宋体字体合并后用于Matplotlib图表的方法:1)使用FontForge合并字体生成times_simsun.ttf;2)将合并字体放入Matplotlib字体目录;3)修改matplotlibrc配置文件,取消注释并添加新字体名称;4)更新fontlist缓存文件;5)在Python代码中设置rcParams参数,指定新字体为默认无衬线字体。该方法解决了Matplotlib同时显示中英文字体的问题,确保图表中文字显示统一美观。
2025-07-10 02:47:11
518
原创 光谱建模中的样本划分方法全景分析——从原理介绍到结果评价
摘要:本文系统归纳了机器学习中四种样本划分方法:1)空间驱动的Kennard-Stone法和Duplex法,通过样本距离优化特征空间分布;2)响应驱动的浓度梯度法,按目标变量均匀采样;3)联合驱动的SPXY法,兼顾特征与响应空间;4)随机划分法。通过玉米光谱数据实验对比了不同方法在训练/验证集的均值差异、变异系数等指标上的表现,发现SPXY方法在7:3比例下能获得最具代表性的验证集。研究强调合理的样本划分对模型泛化能力的重要影响,建议结合统计指标和实际建模效果选择最优方法。
2025-06-23 20:53:27
1615
原创 光谱预处理方法全景分析:干扰识别、方法选择与优化组合
光谱预处理是提升光谱分析精度的关键步骤,主要针对光散射、噪声、基线漂移等干扰因素。常用方法包括Savitzky-Golay滤波去噪、airPLS基线校正、SNV/MSC散射校正以及归一化处理。预处理后需通过PCA或建模指标评估效果,建议采用组合方法并根据数据特点调整参数。本文系统归纳了近红外光谱预处理策略,并提供了MATLAB代码实现,帮助用户快速应用于实际数据分析。预处理可显著提高模型稳健性,但需避免过度处理导致信息失真。
2025-06-18 16:40:16
1666
原创 光谱异常数据剔除-多响应变量建模与蒙特卡罗交叉验证(Multi,MCCV)
摘要:本文提出了一种基于多响应变量建模与蒙特卡罗交叉验证(MCCV)的异常样本检测方法。该方法通过多次随机建模预测,计算各样本在测试集中的加权预测残差(综合考虑水分、油脂、蛋白质等多个指标),统计其均值与方差来识别异常样本。方法支持变量权重设置(总和为1),包含数据完整性检查模块,通过设定双阈值(k1、k2)实现敏感度可调的异常判别。适用于光谱分析等多元建模场景,可有效识别非线性异常样本,为建模前的数据清洗提供新思路。配套MATLAB代码支持多组分分析,具有权重可调、鲁棒性强等特点。
2025-06-17 01:16:19
503
原创 光谱异常数据剔除-蒙特卡洛交叉验证法(Monte Carlo Cross Validation, MCCV)
MCCV(Monte Carlo Cross Validation)法是一种统计模拟方法,通过多次随机划分训练集与测试集,对每个样本的预测误差进行统计分析,从而识别出误差显著偏大的异常样本。其核心思想是:如果某样本多次作为测试样本时的预测残差显著大于其他样本,则认为其为潜在异常样本蒙特卡洛迭代次数;每次训练集比例(如 80%);PLS 主成分数;%% 蒙特卡罗交叉验证的PLS建模% 参数设置:% A - PLS主成分数% 'center' - 数据中心化预处理。
2025-06-16 14:25:54
843
原创 光谱异常数据剔除-MODXY 方法(Multicomponent ODXY
MODXY是ODXY方法的多组分扩展,适用于同时检测多个成分指标(如水分、蛋白质等)。该方法通过计算各组分化学值与平均值的距离之和,并将其与光谱距离建立比例关系来识别异常样本。算法步骤包括:数据导入与预处理、PCA降维、光谱和化学值距离计算、设定阈值判断异常。优点在于多指标综合分析、原理清晰;缺点是对低变异性组分敏感,且需调整阈值参数k。
2025-06-15 01:55:45
508
原创 光谱异常数据剔除-ODXY 方法(Outlier Detection based on joint X-Y distances)
ODXY方法是一种联合分析输入变量X和输出变量Y的异常样本检测技术。该方法基于"XY距离关系定理",通过证明光谱距离与化学值距离的正比关系建立异常判断标准。算法步骤包括PCA降维、距离计算和归一化处理,最终设定阈值(中位数±k倍标准差)识别异常样本。该方法具有运算高效、考虑全面的优点,但仅适用于单组分分析。
2025-06-15 01:40:20
280
原创 数据剔除方法-PCA-马氏距离
PCA-马氏距离法通过衡量样本点与总体中心的距离检测异常值,考虑了变量协方差关系。算法步骤包括PCA降维、计算马氏距离、设定阈值剔除异常样本。该方法简单高效
2025-06-15 01:21:47
447
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅