机器学习是为计算机开发的一种功能,采用学习算法使其模拟人类大脑的学习方式,从而实现各种各样的能力,如网站搜索,图片推荐,清理垃圾邮件等等
学习机器学习,不仅需要知道算法的含义及其数学含义,更重要的是要学会将其应用到实际中
什么是机器学习(machine learning)
在过去,Arthur Samuel 在1959年把机器学习定义为在没有明确的前置条件限制的情况下,使计算机具有学习能力的研究领域;
而Tom Mitchell把机器学习定义为:计算机程序从经验E中学习来解决某一任务T,并进行某一性能度量P,通过P测定在T上的表现因经验E而提高。
举个简单的例子来理解这句话就是,如果我们要编写一个机器学习算法来辅助我们清理垃圾邮件,那么在算法中,经验E就是观察把哪些邮件标记为垃圾邮件,任务T就是给邮件分类,而正确归类邮件的比例就是P。
在机器学习中最常使用的算法就是监督学习和无监督学习
监督学习(supervised learning)
简单的理解就是人为地去教计算机如何学习
先举一个简单的例子:一个人收集了一个城市内许多房屋的面积和售价,如果将其绘制成了散点图,横轴是平方面积数,纵轴是金额,那么他就可以通过拟合这些数据来预估自己手头房屋的售价是多少。但通过直线和二次函数来拟合出来的金额是不一样的,需要他通过市场的经验来判断哪个更合理。