在寒假里,我开始接触到了深度学习,对深度学习里面涉及到的知识点很感兴趣,也希望能在未来的研究生生活中确立为自己的研究方向。
为此,我利用假期时间自学了python的基本操作,并学习了:
一.基本的回归任务
我认为回归任务的重点应该在数据的处理上,不同的数据集有不同的处理方式,
1.(你用什么方式处理的?你是如何挑选需要的特征的?)
当我在做新冠人数预测的数据集时:
1.发现有地区相关的参数值可以使用one-hot的处理方式,
2.对于时间的处理可以将日期格式表示为观测的第几天或者第几个月,
3.而部分参数值如[人数基数]的参数值较大,会对loss产生较大的影响,因此可以采用归一化,
4.当参数值过高时也可以采用selectbest函数
【原理:通过给特征进行打分,然后从高到底选取特征,要用到皮尔森系数和单变量线性回归,皮尔森系数可以表明y与各个特征的相关度单变量线性回归可以用来表明特征的回归效果】
而在训练中为了提高训练效果,我也尝试了不同的训练技巧,得到了不同的结果。
2.(你加入了什么训练技巧,他们的原理是什么)
神经网络固有的两个缺点即费时和