- 博客(14)
- 收藏
- 关注
原创 【脑电分析】使用hctsa工具包处理脑电数据
在该网址中将hctsa工具包下载下来,运行install.m文件,此时会出现“错误使用 compile_mex”报错,要额外安装MinGW-w64 C/C++编译器,然后运行mex -setup进行配置。还可以运行TS_LabelGroups('norm')进行标签分类,TS_PlotTimeSeries('norm')查看标记数据。进行特征计算,由于是运行初始化文件中指定的所有计算,这个步骤计算量过大,可使用。版本,需要注意的是,在重新运行文件时,可能会出现以下问题。查看前20个重要特征。
2025-12-10 19:04:14
217
原创 【脑电笔记】matlab显著性分析
由于预处理步骤涉及到滤波、重参考、ICA分解、ADJUST去伪影等,较为复杂且耗时,我这边就直接用了最开始预处理过的数据并且简化了特征提取数量,Tukey HSD事后检验,对显著特征进行组间两两比较,发现组1 vs 组4中在中央区Alpha功率上差异最大(Cohen’s d = 1.2),组2 vs 组3中前额叶Theta功率有中等差异(Cohen’s d = 0.8)F实际值<F查表值,则p>0.05,查表值来看:显著性差异存在,且p值大于0.05。F实际值>F查表值,则p<=0.05。
2025-09-24 19:35:11
277
原创 【学习笔记06】anova原理和实现
在数据分析中,方差分析(ANOVA)是检验多组数据均值差异的重要方法,但传统参数化 ANOVA 对数据分布有严格假设,且在存在干扰变量、重复测量设计等场景下局限性明显。近期学习了论文《Permutation Tests for Regression, ANOVA, and Comparison of Signals: The permuco Package》,文中基于置换检验提出了更灵活、稳健的 ANOVA 解决方案,并在permuco包中实现。
2025-08-29 10:40:30
830
原创 【学习笔记05】特征选择方法
ANOVA 应用:Davidson 团队 [1] 利用 ANOVA 筛选前额叶 α 波段特征,在维度缩减 40% 的情况下仍保持 91% 的分类准确率,验证了传统统计方法在初步特征筛选中的有效性。Logistic-ARFE 与 GRMOR:Xu 等人 [3,4] 提出的 Logistic-ARFE 框架通过多阶段筛选提升特征质量,GRMOR 则通过全局冗余最小化减少 45% 冗余特征,为处理 EEG 通道高相关性提供了新思路。
2025-08-14 13:24:39
642
原创 【学习笔记04】脑电分析特征选择部分内容
上一周已总结完脑电分析的数据预处理部分,特征提取是预处理后的下一步,是生物医学信号分析的重要步骤。本周我学习的是特征选择分支。
2025-08-07 15:23:59
363
原创 学习笔记02--脑电分析数据处理和环境配置
错误类型解决方案uimenu错误升级EEGLAB到最新版路径警告仅添加根目录,避免全路径插件加载失败单独安装兼容版本插件以上就是本周的学习成果,对于eeglab用法还有一些不熟练,部分图片没有放出来,一开始用了emotiv中的自带软件testbench将edf转换成csv格式,后续如有用到我会将它写出来。
2025-07-15 23:33:09
1124
原创 【机器学习】PCA降维
在机器学习领域,高维数据处理一直是个重要挑战。今天我们将探索主成分分析(PCA) 这一经典降维技术在人脸数据集上的应用,通过可视化展示数据的内在结构,并对比原始数据与降维重构的效果。PCA是一种无监督降维技术,其核心思想是通过正交变换将高维数据投影到低维空间,保留最大方差的方向(主成分)。在人脸识别中,这些主成分被称为"特征脸"(Eigenfaces)。通过PCA这一数学优美的降维技术,我们不仅实现了数据的压缩,更揭开了高维人脸数据的内在结构。
2025-06-09 14:11:05
604
原创 垃圾邮件分类实验:基于MATLAB数据集的机器学习实践
本次实验我使用了一个名为spamTest.mat的MATLAB数据集,通过Python实现了垃圾邮件分类系统。实验中我探索了数据特征,实现了朴素贝叶斯分类器,并对模型性能进行了全面评估。朴素贝叶斯模型在垃圾邮件分类任务中表现优异,测试准确率达96.52%模型召回率较高(Ham:98%, Spam:94%),表明漏判较少最具区分性的特征主要集中在特定索引范围内(1470-1501)
2025-06-02 20:16:45
345
原创 使用Python实现朴素贝叶斯分类器进行西瓜数据分类及后验概率计算
贝叶斯分类器是一种基于贝叶斯定理的概率分类方法,广泛应用于机器学习领域。本文以周志华《机器学习》中的西瓜数据集3.0为例,手动实现朴素贝叶斯分类器,并详细讲解如何计算后验概率。通过本文,读者将了解如何处理离散和连续特征,并利用Python实现完整的分类流程。本文手动实现了朴素贝叶斯分类器,处理了离散和连续特征,并通过后验概率进行决策。方法简单有效,但对特征独立性假设敏感。改进方向包括引入特征相关性处理或使用其他概率分布模型。
2025-05-05 21:05:10
1171
原创 决策树实战
本文将以银行贷款审批场景为例,结合具体数据集(数据表.xlsx、dataset.txt、testset.txt),深入解析决策树的核心原理、算法实现及优化策略,并对比不同算法(ID3、C4.5、CART)的差异,最终构建一个高泛化能力的贷款审批模型。本文通过银行贷款数据集,演示了决策树从数据预处理到模型优化的完整流程。决策树的优势在于其直观性和灵活性,但在实际应用中需结合剪枝和参数调优以平衡复杂度与泛化能力。
2025-04-21 19:56:37
952
原创 用KNN算法和ROC曲线评估分类模型性能
在机器学习分类任务中,评估模型性能的指标有很多种,但ROC曲线和AUC值始终是衡量二分类模型优劣的黄金标准。本文将以癌症数据集为例,用KNN算法实现分类预测,并通过可视化ROC曲线和AUC值,深度解析模型性能的评估方法。真正率(TPR):正确识别正类的比例(如癌症患者被正确诊断为患癌的概率)。假正率(FPR):负类被误判为正类的比例(如健康人被误诊为患癌的概率)。ROC曲线通过调整分类阈值,绘制TPR和FPR的变化轨迹,反映模型在不同阈值下的表现。
2025-04-07 20:07:20
607
原创 基于k近邻算法的分类器的实现
KNN(K-Nearest Neighbors,K最近邻)算法是一种基本的监督学习算法,广泛用于分类和回归任务。它的基本思想是:给定一个数据点,通过计算其与训练集中所有数据点的距离,选取距离最近的 K 个邻居,然后根据这些邻居的信息进行分类或预测。
2025-03-24 21:03:57
596
原创 Anaconda安装方法及环境变量配置
本文介绍了配置Anaconda环境变量的详细步骤以上是Anaconda的安装方法及环境变量配置,如有不对请指正。
2025-03-10 23:03:53
1094
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅