首先,这篇笔记是在3.2日学习完深度学习计算后,希望将数据集搭建简单网络模型测试中遇到的各种问题,在几天的查阅资料过程中多次尝试解决方法,写的总结。
第一个问题:为什么数据集用SVM网格搜索可以得到良好结果
数据集构建
本数据集是通过实验采集,变量控制良好,原始数据良好。
特征数据转换为可用于机器学习的数字特征
经过更多的查阅资料和这方面数据提供者对数据集的介绍,原始数据已经被转化成数字特征方便学习。
普通数据特征
例如以下特征等上百种特征:
最小值、min
最大值、max
均值、mean
中值、median
均方根、RMS():Root mean square
四分位数、Quartile(25%, 50% , 75%)
轴间相关系数、cc_axis(): Correlation coefficient between axis
皮尔逊相关系数
小波包变换子带能量及其子带能量之和
过零率、ZCR(Zero crossing rate)
偏度、Skewness
峰度,Kurtosis
加速度数据特征
时域——均值、标准差、方差、四分位数范围(IQR)、平均绝对偏差(MAD)、轴间相关性、熵和峰度。子空间池的技术(将原始复杂的输入数据建模/投影到新的维度中)。频域——傅里叶变换,和离散余弦变换。

本文总结了在深度学习实践中遇到的问题,包括为何SVM在数据集上表现良好,以及如何处理数据集进行softmax分类。作者提到数据集已进行了特征转换,但建议保留异常值以学习特殊情况。在PyTorch中,将数据从DataFrame转为Tensor并处理精度问题是实现模型的关键步骤。
最低0.47元/天 解锁文章
2797

被折叠的 条评论
为什么被折叠?



