Machine Learning

最新推荐文章于 2024-04-22 09:41:20 发布

原创最新推荐文章于 2024-04-22 09:41:20 发布 · 166 阅读

CC 4.0 BY-SA版权

本文深入浅出地介绍了机器学习的基本概念，涵盖了从数据收集到模型部署的全过程，解析了线性回归、逻辑回归等核心算法，并探讨了损失函数、代价函数在模型优化中的作用。

Machine Learning(ML) is a scientific discipline that deals with the construction and study of algorithms that can learn from data

机器学习是一门从数据中研究算法的科学学科
机器学习直白来讲，是根据已有的数据，进行算法选择，并基于算法和数据构建模型，最终对未来进行预测
机器学习就是一种模拟人决策过程的一种程序结构

机器学习是人工智能的一个分支，我们使用计算机设计一个系统，使它
能够根据提供的训练数据按照一定的方式来学习，随着训练次数增加，该系统可以在性能上不断学习和改进，通过参数优化的学习模型，能够用于预测相关问题的输出

机器学习中是无法得到一个完美函数

线性回归
逻辑回归
KNN
CART
朴素贝叶斯
SVM
K-Mean
AdaBoost
HMM
条件随机变量

数据收集
数据预处理
特征提取
模型构建
模型测试评估
投入使用（模型部署与整合）
迭代优化

KNN

特征工程

线性回归

$(w_1,w_2,\cdots,w_n,b)^T \\ x = (x^{(1)},x^{(2)},\cdots,x^{(n)},1)^T \\ h(x) = w^T \cdot x$
损失函数： $loss(θ)=(y^i−yi)2loss(\theta)=(\hat y_i - y_i)^2$ ，其中 $y^i=hθ(xi)\hat y_i =h_\theta(x_i)$
代价函数： $Cost(θ)=1N∑i=1N(y^i−yi)2Cost(\theta)=\frac{1}{N}\sum_{i=1}^N (\hat y_i - y_i)^2$ ，其中 $y^i=hθ(xi)\hat y_i =h_\theta(x_i)$
目标函数: $Obj(θ)=1N∑i=1Nloss(y^i,yi)Obj(\theta) = \frac{1}{N}\sum_{i=1}^Nloss(\hat y_i,y_i)$

$h(θ)=θ0+θ1x1+⋯+θnxn=∑i=0nθixi=θTxh(\theta) = \theta_0 + \theta_1x_1 + \cdots + \theta_nx_n = \sum_{i=0}^n\theta_ix_i=\theta^Tx$
最终要求计算出 $θ\theta$ 的值，并选择最优的 $θ\theta$ 值构成算法公式