Machine Learning(ML) is a scientific discipline that deals with the construction and study of algorithms that can learn from data
机器学习是一门从数据中研究算法的科学学科
机器学习直白来讲,是根据已有的数据,进行算法选择,并基于算法和数据构建模型,最终对未来进行预测
机器学习就是一种模拟人决策过程的一种程序结构
机器学习是人工智能的一个分支,我们使用计算机设计一个系统,使它
能够根据提供的训练数据按照一定的方式来学习,随着训练次数增加,该系统可以在性能上不断学习和改进,通过参数优化的学习模型,能够用于预测相关问题的输出
机器学习中是无法得到一个完美函数
线性回归
逻辑回归
KNN
CART
朴素贝叶斯
SVM
K-Mean
AdaBoost
HMM
条件随机变量
- 数据收集
- 数据预处理
- 特征提取
- 模型构建
- 模型测试评估
- 投入使用(模型部署与整合)
- 迭代优化
KNN
特征工程
线性回归
w=(w1,w2,⋯ ,wn,b)Tx=(x(1),x(2),⋯ ,x(n),1)Th(x)=wT⋅x
w = (w_1,w_2,\cdots,w_n,b)^T \\
x = (x^{(1)},x^{(2)},\cdots,x^{(n)},1)^T \\
h(x) = w^T \cdot x
w=(w1,w2,⋯,wn,b)Tx=(x(1),x(2),⋯,x(n),1)Th(x)=wT⋅x
损失函数:loss(θ)=(y^i−yi)2loss(\theta)=(\hat y_i - y_i)^2loss(θ)=(y^i−yi)2,其中y^i=hθ(xi)\hat y_i =h_\theta(x_i)y^i=hθ(xi)
代价函数:Cost(θ)=1N∑i=1N(y^i−yi)2Cost(\theta)=\frac{1}{N}\sum_{i=1}^N (\hat y_i - y_i)^2Cost(θ)=N1i=1∑N(y^i−yi)2,其中y^i=hθ(xi)\hat y_i =h_\theta(x_i)y^i=hθ(xi)
目标函数:Obj(θ)=1N∑i=1Nloss(y^i,yi)Obj(\theta) = \frac{1}{N}\sum_{i=1}^Nloss(\hat y_i,y_i)Obj(θ)=N1i=1∑Nloss(y^i,yi)
h(θ)=θ0+θ1x1+⋯+θnxn=∑i=0nθixi=θTxh(\theta) = \theta_0 + \theta_1x_1 + \cdots + \theta_nx_n = \sum_{i=0}^n\theta_ix_i=\theta^Txh(θ)=θ0+θ1x1+⋯+θnxn=i=0∑nθixi=θTx
最终要求计算出θ\thetaθ的值,并选择最优的θ\thetaθ值构成算法公式
minJ(θ)=12∑i=1m(ε(i))2=12∑i=1m(hθ(x(i)−y(i)))2 minJ(\theta) = \frac12\sum_{i=1}^m(\varepsilon^{(i)})^2=\frac12\sum_{i=1}^m(h_\theta(x^{(i)}-y^{(i)}))^2 minJ(θ)=21i=1∑m(ε(i))2=21i=1∑m(hθ(x(i)−y(i)))2
极大似然估计
本文深入浅出地介绍了机器学习的基本概念,涵盖了从数据收集到模型部署的全过程,解析了线性回归、逻辑回归等核心算法,并探讨了损失函数、代价函数在模型优化中的作用。
7353

被折叠的 条评论
为什么被折叠?



