ML模型特点以及区别

最新推荐文章于 2025-06-02 22:14:15 发布

原创

最新推荐文章于 2025-06-02 22:14:15 发布 · 5.9k 阅读

13 ·

CC 4.0 BY-SA版权

本文详细对比了线性回归（LR）、支持向量机（SVM）的特点，包括它们的优缺点，如LR的简单快速但对异常值敏感，SVM在处理非线性问题上的优势但计算复杂度高。同时，提到了其他模型如随机森林（RF）和梯度提升决策树（GBDT）的优势和不足，以及Bagging和Boosting的区别。

https://blog.youkuaiyun.com/b285795298/article/details/81977271

线性回归

优点：
1、简单，运算速度块
2、可以根据系数对变量做出解释
缺点：
1、对异常值敏感

LR

优点：
1、形式简单，可解释性好
2、模型效果好
3、训练速度快
4、资源占用少，尤其是内存
5、方便输出结果的调整（人工设定阈值）
缺点：
1、准确率可能并不是很高
2、很难处理数据不平衡的问题
3、处理非线性数据麻烦
4、LR本身无法筛选特征
5、对异常值敏感

SVM

优点：
1、svm再中小量样本规模的时候容易得到数据和特征之间的非线性关系，可以避免使用神经网络结构选择和局部极小值问题，可解释性强，可以解决高维问题。
2、抗噪能力强
缺点：
1、对缺失数据敏感，对非线性问题没有通用的解决方案，核函数的正确选择不容易，计算复杂度高，不使用于大规模的数据。

LR和SVM的区别：

相同点：
1.都是分类算法；
2.都是监督算法；
3.都是判别式模型；
4.不考虑核函数，都是线性分类算法；

不同点：
1、LR采用log损失，SVM采用合页损失，前者基于概率论原理，后者基于几何间隔最大化原理；
2、LR对异常值敏感，SVM抗噪能力强；r

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

42~

关注关注

1
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

一句话概括 —— ML（机器学习）

weixin_64304788的博客

04-19

1860

聚类算法：无监督学习算法，根据样本之间的相似度将样本分为多个类别。K-Means简单易懂易于实现，但也与生俱来有一些明显的缺陷，比如算法依赖K值的选择、初始点的选择、样本的分布，以及对异常值非常敏感、在大样本数据集上性能较差。K-means的损失函数是求所有数据点与所在簇的中心点的距离之和逻辑回归：是一种广义的线性回归模型，主要用于数据挖掘、疾病自动诊断、经济预测等。常用于二分类场景，通过sigmoid来把输出结果映射为0-1的概率值朴素贝叶斯： ...

第L2周：ML｜线性回归模型

qq_40879041的博客

09-19

860

如果你只使用一个特征来预测另一个特征，那么这种情况下模型是可以工作的，但通常这不是机器学习中的标准做法，因为模型将无法从多个特征中学习。这里我们采用“学习时长-成绩”数据集，采用LinearRegression简单线形回归模型，通过学习时长去预测学生成绩。(3) fit 的作用：找到最佳的线性关系，即最佳拟合线，来描述。(2) 这段代码初始化了一个线性回归模型，并使用训练数据集。对象可以用来对新的特征数据进行预测，以估计目标变量的值。

参与评论您还未登录，请先登录后发表或查看评论

ML之基本概念和建模流程

CH3_CH2_CHO的博客

06-02

1065

注意：数据集中的列也被称为字段，鸢尾花数据集中总共有5列，也就总共有5个字段。

ML模型选择

Rocket,Qian的博客

09-20

853

模型选择1. 穷举搜索选择最佳模型2. 随机搜索选择最佳模型3. 从多种学习算法中选择最佳模型4. 将数据预处理加入模型选择过程5. 并行化加速模型选择6. 使用针对特定算法的方法加速模型选择7. 模型选择后的性能评估在机器学习中，通过最小化某个损失函数的值来训练算法以学习一个模型的参数。此外，许多算法(如支持向量机和随机森林)还有一些超参数，这些超参数必须在学习过程之外定义。将选择最佳学习算法以及选择最佳超参数的过程称为模型选择。 1. 穷举搜索选择最佳模型通过搜索一系列的超参数来选择最佳模型使用

ML建模

Innovat1on的博客

05-09

813

在数据分析了之后就可以进行模型的建立了，机器学习模型有很多，建议均作尝试，不仅可以测试效果，还可以学习各种模型的使用技巧。其实，几乎每一种模型都有回归和分类两种版本，并且直接有scikit-learn、XGBoost、LightGBM这些库，直接可以用！对于模型，经典的要会推导，每种应用的模型要明确工作原理，大白话讲出来！对于重要的公式要回写。（random forest一般效果比较好）错误...

Core ML（iOS机器学习）：iOS设备上的模型量化与压缩详解及实践

03-18

主要内容涵盖Core ML框架的特点、量化和压缩技术的基础原理，量化示例（包括静态量化、动态量化和混合精度量化），剪枝及其他压缩技术（如知识蒸馏、模型架构优化）。文章还讨论了量化和压缩带来的模型性能变化，并...

边缘智能驱动的分布式ML模型协同训练通信资源优化.docx

06-28

接着，研究者给出了理论框架与方法，包括边缘智能的定义与特点、分布式ML模型的架构、通信资源优化模型，以及协同训练机制设计。在系统设计与实现环节，文档详细介绍了系统的总体设计思路、关键模块的设计、实验环境...

精选资源

Yolov5Wpf:使用ML.NET部署YOLOV5的ONNX模型

03-14

YOLOv5Wpf是一个基于C#开发的项目，它利用了Microsoft的ML.NET框架来部署YOLOv5的ONNX（Open Neural Network Exchange）模型。这个项目的主要目的是在Windows Presentation Foundation (WPF) 应用程序中实现目标检测...

人工智能大模型端侧轻量化部署：TensorFlow Lite与Core ML实战揭秘及应用前景分析

最新发布

08-26

内容概要：本文详细探讨了大模型在端侧基于 TensorFlow Lite 和 Core ML 的轻量化部署，涵盖其背景意义、技术原理、实践步骤及挑战应对。随着物联网设备的增长和对实时性、隐私性的要求提升，端侧部署成为研究热点。...

ML模型1：线性回归

l75326747的博客

10-23

1692

文章目录1. 线性模型表示2. 最小二乘法3. 误差4. 最大似然估计5. 求解5.1 求解-正规方程法：5.2 求解-梯度下降6. 评估方法7. 广义线性模型回归在数学上来说是给定一个点集，就能够用一条曲线去拟合之。如果这个曲线是一条直线（超平面），那就被称为线性回归。若不是一条直线则称为非线性回归，常见有多项式回归、逻辑回归等。线性模型优劣：优点：结果易于理解，计算上不复杂；缺点：对非...

神经元 ML模型

12-02

神经元单振子 ML模型神经计算神经网络

MLModels：许多常见ML模型的自制实现，包括神经网络，逻辑线性回归

02-14

ML模型许多常见ML模型的自制实现，包括神经网络，线性模型和决策树。强调 MNIST基准导入/获取数据 import numpy as np np . random . seed ( 0 ) import matplotlib . pyplot as plt % matplotlib inline from functools import reduce import neuralNet as nn import utils as u from torchvision import datasets # Only to get MNIST data train_dataset = datasets . MNIST ( './data' , train = True , download = True ) test_dataset = datasets . MNIST ( './da

ML-线性模型

Lau's Blog

01-19

1550

线性模型定义：线性模型是一类统计模型的总称，制作方法是用一定的流程将各个环节连接起来，包括线性回归模型、方差分析模型。----来自百度百科我个人觉得这句话根本就没有说清楚线性模型的定义。我个人的理解是，将某个事物的某些属性通过线性组合来进行预测的函数方程（欢迎有不同见解的前来批评指正）。首先，线性模型是一种统计模型，与之对应的自然是非线性模型，在这里不展开来说；其次线性模型用来做一些预测。这也是函数的本质，通过已知的数据，利用某个模型去预测结果。 ...

ML模型评估

weixin_43825323的博客

09-14

415

一、评估方法留出法hold-out 留出法直接将数据集D划分为两个互斥的集合，其中一个集合作为训练集S，另一个作为测试集T，即$D=S \cup T,S \cap T = \varnothing ，在，在，在S上训练处模型后，用上训练处模型后，用上训练处模型后，用T$来评估其测试误差，作为对泛化误差的估计。注意：训练/测试集的划分要尽可能保存数据分布的一致性，避免因数据划分过程引入额外的偏差而对最终结果产生影响。——例如，在分类任务中至少要保存样本的类别比例相似。交叉验证cross validatio

ML——逻辑回归模型

toutuo

04-14

2212

Table of Contents 1 逻辑回归模型 1.1 逻辑斯谛分布 1.2 二项逻辑斯蒂回归模型 1.3 模型参数估计 2 优化算法 3 代码实现本博客只用于自身学习，如有错误，虚心求教！！！ 1 逻辑回归模型 1.1 逻辑斯谛分布 1.2 二项逻辑斯蒂回归模型二项逻辑斯蒂回归模型是一种分类模型，由条件概率分布表示，X取值为实数，Y取值为 1 或 ...

【ML】模型融合

wffzxyl的博客

05-09

638

问题来源，即机器学习性能提升方向：1. 特征工程2. 调参3. 模型融合模型融合原理 1989,Schapire，证明：在PAC学习的框架下，⼀个概念是强可学习的充分必要条件是这个概念是弱可学习。因此，只要找到⼀个⽐随机猜测略好的弱学习算法就可以直接将其提升为强学习算法，⽽不必直接去找很难获得的强学习算法。或者, 假设各弱分类器间具有一定差异性（如不同的算...

AI杂谈（1）你喜欢ML里的哪些模型？希望ML未来向什么方向发展？

weixin_34088838的博客

07-05

136

发信人: EchoState (AI), 信区: AI标题: 你喜欢ML里的哪些模型？希望ML未来向什么方向发展？发信站: 水木社区 (Sun Jun 17 01:27:00 2007), 站内最近闲得没事瞎琢磨，感兴趣的一起来聊聊我只是个Beginner，肯定有很多地方说的错误。欢迎大家纠正和讨论。文中的ML = Machine Learning，禁止无端联想~~~~~ Machine...

【ML】马尔可夫模型

Esperanto.的博客

04-20

423

马尔可夫模型以及HMM简述

transformer的ml模型

04-10

### Transformer 机器学习模型架构、实现与应用 #### 架构概述 Transformer 是一种基于自注意力机制（self-attention mechanism）的深度学习模型，最初由 Vaswani 等人在 2017 年提出[^1]。其核心特点是摒弃了传统的 RNN 和 CNN 结构，通过多头注意力机制（multi-head attention）和前馈神经网络实现了高效的序列建模能力。 #### 关键组件详解 1. **自注意力机制 (Self-Attention)** 自注意力机制使得模型能够在一次操作中关注输入序列的所有位置，而无需逐个处理。这种特性显著提高了计算效率，并增强了对上下文的理解能力[^1]。 2. **多头注意力 (Multi-Head Attention)** 多头注意力机制扩展了单一的自注意力结构，允许多个独立的注意力头并行工作，从而捕获更丰富的特征表示。每个头部专注于不同的子空间，最终的结果是这些头部输出的拼接[^1]。 3. **堆叠层 (Stacked Layers)** Transformer 的编码器和解码器均由多个相同结构的层堆叠构成。每一层都包含一个多头注意力模块以及一个前馈神经网络，二者均辅以残差连接和层归一化技术，有效缓解了梯度消失问题。 4. **位置编码 (Positional Encoding)** 由于 Transformer 不具备内在的时间/顺序感知能力，因此需要显式地加入位置信息。位置编码向量被加到词嵌入上，帮助模型区分同一词语的不同出现位置。 5. **编码器与解码器 (Encoder & Decoder)** 编码器负责接收输入序列并生成上下文表征；解码器则利用该表征逐步生成目标序列。两者共同构成了完整的端到端框架，广泛应用于诸如机器翻译等任务中[^1]。 #### 实现细节以下是使用 PyTorch 框架实现 Transformer 的基本代码示例： ```python import torch.nn as nn import torch class PositionalEncoding(nn.Module): def __init__(self, d_model, max_len=5000): super(PositionalEncoding, self).__init__() pe = torch.zeros(max_len, d_model) position = torch.arange(0, max_len).unsqueeze(1) div_term = torch.exp(torch.arange(0, d_model, 2) * -(torch.log(torch.tensor(10000.0)) / d_model)) pe[:, 0::2] = torch.sin(position * div_term) pe[:, 1::2] = torch.cos(position * div_term) pe = pe.unsqueeze(0) self.register_buffer('pe', pe) def forward(self, x): return x + self.pe[:, :x.size(1)] class TransformerModel(nn.Module): def __init__(self, src_vocab_size, tgt_vocab_size, embed_dim, num_heads, num_encoder_layers, num_decoder_layers, dim_feedforward, dropout=0.1): super(TransformerModel, self).__init__() self.src_embedding = nn.Embedding(src_vocab_size, embed_dim) self.tgt_embedding = nn.Embedding(tgt_vocab_size, embed_dim) self.positional_encoding = PositionalEncoding(embed_dim) self.transformer = nn.Transformer( d_model=embed_dim, nhead=num_heads, num_encoder_layers=num_encoder_layers, num_decoder_layers=num_decoder_layers, dim_feedforward=dim_feedforward, dropout=dropout ) self.fc_out = nn.Linear(embed_dim, tgt_vocab_size) def forward(self, src, tgt, src_mask=None, tgt_mask=None): src_emb = self.positional_encoding(self.src_embedding(src)) tgt_emb = self.positional_encoding(self.tgt_embedding(tgt)) output = self.transformer(src_emb, tgt_emb, src_mask=src_mask, tgt_mask=tgt_mask) return self.fc_out(output) ``` 上述代码定义了一个标准的 Transformer 模型，其中包含了位置编码、多头注意力以及其他必要的组件[^3]。 #### 应用场景 Transformer 已经成为众多 NLP 领域的标准工具，特别是在以下方面表现突出： - **机器翻译**：作为经典的 sequence-to-sequence 学习范式，Transformer 提供了高效且高质量的解决方案[^1]。 - **文本摘要**：通过对文档内容的有效压缩，生成简洁明了的总结。 - **问答系统**：借助强大的语义理解能力，能够准确回应复杂查询[^2]。 - **情感分析**：识别文本中的情绪倾向，辅助商业决策和社会研究。 #### 训练优化技巧为了提升训练稳定性及收敛速度，可以采用如下策略： - 使用全局梯度裁剪防止梯度过大引发数值不稳定现象[^4]。 - 引入批量标准化（Batch Normalization）进一步改善内部协变量偏移问题。 --- 问题