机器学习定义
机器学习是一类强大的可以从经验中学习的技术。通常采用观测数据或与环境交互的形式,机器学习算法会积累更多的经验,其性能也会逐步提高。
机器学习的分类
(1)按任务类型分,机器学习模型可以分为回归模型、分类模型和结构化学习模型。
(2)从方法的角度分,可以分为线性模型和非线性模型,非线性模型又可以分为传统机器学习模型(SVM,KNN,决策树等)和深度学习模型。
(3)按照学习理论分,机器学习模型可以分为有监督学习、半监督学习、无监督学习、迁移学习和强化学习。
监督学习
监督学习擅长在“给定输入特征”的情况下预测标签。每个“特征-标签”对都称为一个样本。我们的目标是生成一个模型,能够将任何输入特征映射到标配
标注问题
学习预测不相互排斥的类别问题称为多标签分类
上图中有鹿,狗,猫 ,鸡这属于多标签分类问题
回归——平方误差损失函数
回归是最简单的监督学习任务之一。
线性回归
公式 y=ax➕b,几个因素与a有关,因素占比越大a的占比越大,
a为权重,决定了每个特征对我们预测值的影响
b为偏重
例如房价选择
1. 变量选取