机器学习日记(1)
机器学习是什么?
机器学习(Machine Learning)致力于研究如何通过计算的手段,模拟或实现人类的学习行为,以获取新的知识或技能,并以此来改善系统自身的性能。一个经典的机器学习的定义为:一个程序被认为能从经验E中学习,解决任务 T,达到性能度量值P,当且仅当,有了经验E后,经过P评判, 程序在处理T时的性能有所提升。
机器学习的最主要的两类算法
根据训练数据是否有标记信息可划分为监督学习(Supervised learning)和无监督学习(Unsupervised learning)。
监督学习(Supervised learning)
监督学习是指从标注数据中学习预测模型的机器学习问题,本质是学习输入到输出的映射的统计规律。
标注数据:用于表示输入输出的对应关系。
预测模型:对给定的输入产生相应的输出。
监督学习可主要分为回归(Regression)问题与分类(Classfication)问题。
回归(Regression)问题
在吴恩达的机器学习课程有以下例子:
一个学生从波特兰俄勒冈州的研究所收集了一些房价的数据。你把这些数据画出来,看起来是这个样子:横轴表示房子的面积,单位是平方英尺,纵轴表示房价,单位是千美元。那基于这组数据,假如你有一个朋友,他有一套 750 平方英尺房子,现在他希望把房子卖掉,他想知道这房子能卖多少钱