机器学习Tom Mitchell定义:如果T(task)在一个度量标准(判断的正确率)P(performance
measure)以上随着经验 E(experience)自我完善,则称计算机程序从经验E中自我学习。
比如T:垃圾邮件分类,P:正确分类垃圾邮件,E:观察哪些邮件是垃圾邮件,哪些不是。
机器学习算法:监督学习和非监督学习.
监督学习(回归问题):给定一些正确的数据作为训练集,然后用这些数据集拟合出来一个公式,然后用这个公式再去预测未知的问题,比如房价,股票价格等等。
如何分辨回归问题和分类问题?
回归问题预测的结果是连续值,如预测明天的温度,房价;分类问题预测的结果是离散的,如判断明天的天气-阴,雨,晴,或判断一张图片是猫还是狗。
非监督学习:将数据集自动分类,通常采用聚类算法。
分类和聚类的区别?
分类是按照某种标准给对象贴标签,在根据标签来区分归类。聚类是事先没有标签,而通过某种成团分析找出事物之间存在聚集性原因的过程。