时间过得很快,转眼间就要到了准备毕业论文的时候了。研究生的毕业论文不能像本科一样简单的发现规律,将规律表达出来便可。研究生的论文更像是一种通过发现现实问题,进行深入研究后,再将现象提炼出来进行规律总结最后对问题提出更为科学的解决方案。重点在这个提炼与应用的过程,也是很痛苦的一个过程。需要查看大量的文献,了解国际最新研究动态。运用很多较为先进的方法进行操作。特别是瞻仰过几篇师兄的毕业论文之后,发现我现在掌握的知识还远远不够。经过导师的点播,我决定往机器学习方面靠。这也是能够很好挖掘论文深度的一个方面。对我来说也是打开了一个新的领域。以下便是我学习了机器学习一段时间后的一个认识。
所谓机器学习其实也可以叫做统计学习,主要以计算机和网络为平台,对大量数据进行研究,目的是发现规律并进行预测分析的过程。这其中会用到很多的方法,也是机器学习的核心所在。何为学习,Herbert A.Simon说过:如果一个系统能够通过执行某个过程改进它的性能,这就是学习。
学习机器学习的总体目的便是考虑运用什么样的模型对数据进行学习,使得得到的模型能够更好的对数据进行预测,提高学习效率。方法有很多,模型也很多。通过一段时间的学习,所谓机器学习的主要过程可提炼为以下几点:
①得到一个有限的训练数据集合
②确定包含所有可能的模型的假设空间,即学习模型的集合
③确定模型选择的准则,即学习的策略
④实现求解最优模型的算法,即学习的算法
⑤通过学习方法选择最优模型
⑥利用学习的最优模型对新数据进行预测分析
机器学习方法的三要素为:模型(模型的假设空间)、策略(模型选择的准则)、算法(模型学习的算法)
对于学习模型的好坏也有这一套评判方法,比如0-1损失函数、平方损失函数、对数损失函数、绝对损失函数等。通过这些判断预测的好坏,便有了经验风险最小化的方法即: