【机器学习】参数与超参数

最新推荐文章于 2025-06-28 00:36:34 发布

HelloZEX

最新推荐文章于 2025-06-28 00:36:34 发布

阅读量883

点赞数

分类专栏：机器学习

机器学习专栏收录该内容

16 篇文章

订阅专栏

机器学习中的模型参数和模型超参数在作用、来源等方面都有所不同，而模型超参数常被称为模型参数，这样，很容易对初学者造成混淆。本文给出了模型参数和模型超参数的定义，并进行了对比，指出了二者本质上的区别：模型参数是模型内部的配置变量，可以用数据估计模型参数的值；模型超参数是模型外部的配置，必须手动设置参数的值。

我们在做研究的时候，会碰到很多术语。有时，在不同的研究领域还会出现同样名称的术语。比如，统计学、经济学中经常使用的“模型参数”和“模型超参数”，在机器学习中也同样存在。

机器学习领域中的“模型参数”“模型超参数”在作用、来源等方面都有所不同，初学者如果对二者没有明确的认识，学习起来往往会比较吃力，尤其是那些来自统计学和经济学领域的初学者们。

为了让大家在应用机器学习时，对“参数模型”和“超参数模型”有一个清晰的界定，在这篇文章中，我们将具体讨论这两个术语。

首先，我们来看一下“参数”是什么？

参数作为模型从历史训练数据中学到的一部分，是机器学习算法的关键。

统计学中的“参数”：

在统计学中，你可以假设一个变量的分布，比如高斯分布。高斯分布的两个参数分别是平均值（μ）和标准差（sigma）。这在机器学习中是有效的，其中这些参数可以用数据估计得到并用作预测模型的一部分。

编程中的“参数”：

编程中可以将参数传递给函数。在这种情况下，参数是一个函数参数，可以有一个值范围。在机器学习中，您正在使用的具体模型就是函数，需要参数才能对新数据进行预测。

“参数”和“模型”有什么关系？

根据经典的机器学习文献，可以将模型看作假设，而参数是根据特定的数据集对假设进行的具体调整。

模型是否具有固定或可变数量的参数，决定了模型是“参数”模型或“非参”模型。

什么是模型参数？

简单来说，模型参数就是模型内部的配置变量，可以用数据估计它的值。

具体来讲，模型参数有以下特征：

进行模型预测时需要模型参数。

模型参数值可以定义模型功能。

模型参数用数据估计或数据学习得到。

模型参数一般不由实践者手动设置。

模型参数通常作为学习模型的一部分保存。

通常使用优化算法估计模型参数，优化算法是对参数的可能值进行的一种有效搜索。

模型参数的一些例子包括：

人造神经网络中的权重。

支持向量机中的支持向量。

线性回归或逻辑回归中的系数。

什么是模型超参数？

模型超参数是模型外部的配置，其值不能从数据估计得到。

具体特征有：

模型超参数常应用于估计模型参数的过程中。

模型超参数通常由实践者直接指定。

模型超参数通常可以使用启发式方法来设置。

模型超参数通常根据给定的预测建模问题而调整。

怎样得到它的最优值：对于给定的问题，我们无法知道模型超参数的最优值。但我们可以使用经验法则来探寻其最优值，或复制用于其他问题的值，也可以通过反复试验的方法。

模型超参数的一些例子包括：

训练神经网络的学习速率。

支持向量机的C和sigma超参数。

k邻域中的k。

“模型参数”和“模型超参数”

二者的联系：

当针对特定问题调整机器学习算法时，例如在使用网格搜索或随机搜索时，你将调整模型或命令的超参数，以发现一个可以使模型预测最熟练的模型参数。许多模型中重要的参数无法直接从数据中估计得到。例如，在K近邻分类模型中...这种类型的模型参数被称为调整参数，因为没有可用的分析公式来为其计算一个合适的值。

- 第64-65页，应用预测建模，2013

区分：

模型超参数通常被称为模型参数，这种叫法很容易让人产生误解。解决这个问题的一个很好的经验法则如下：如果你必须手动指定一个“模型参数”，那么它可能就是一个模型超参数。

进一步阅读

超参数-维基百科 - https://en.wikipedia.org/wiki/Hyperparameter
什么是机器学习中的超参数？Quora - https://www.quora.com/What-are-hyperparameters-in-machine-learning
模型超参数和模型参数有什么区别？StackExchange- https://datascience.stackexchange.com/qu
什么是超参数？Reddit -https://www.reddit.com/r/MachineLearning/comments/40tfc4/what_is_considered_a_hyperparameter/

总结

读完这篇文章可以了解模型参数和模型超参数的明确定义和区别。

总而言之，模型参数是从数据中自动估计的，而模型超参数是手动设置的，并用于估计模型参数的过程。

博客等级

码龄9年

264
原创

703
点赞

3000
收藏

485
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 【数据结构】（树总结）二叉树搜索/查找树

下一篇：: 【算法/剑指Offer】给一个链表，若其中包含环，请找出该链表的环的入口结点，否则，输出null。

最新评论

【C++笔记】如何判断2个线段相交
枝江谱信楠: 啊笑死
【C++笔记】如何判断2个线段相交
xybf: wok就是这，我调了两个小时[裂开]
【C++笔记】原码、反码、补码
做而论道_CS: 用 C 编程，如：　i = －125;　。这语句中的负数：－125;，是五个 ASCII 码：“－、1、2、5、；”。把 ASCII 码形式的负数 “－125”，　变成补码 1000 0011，　　是怎么变换的？可以肯定的说：根本就不是取反加一！原码反码取反加一。。。　可说是：一无是处。
【C++笔记】原码、反码、补码
做而论道_CS: 在 C 和 C++ 中编程，只需用到【正负十进制数】。该数值，存入内存，必定是【补码】。因此，学习 C 语言，只会遇上【数值和补码】。绝对不会碰上：原码和反码。那么，讨论原码和反码，是不是无事生非呢？
【C++笔记】原码、反码、补码
做而论道_CS: 同理，求正数的补码，公式则为：　正数的补码 = 256 + 该正数。要知道，加上 256，就是出现一个进位。进位必须舍弃，所以，256 就不用加了。于是有：　正数的补码 = 该正数。在此处，这就证明了：　零和正数的补码，就该数字本身。举例，就不用了吧。计算机专家也是说：　正数的补码，就是其自身。但是，他们并没有给出任何证明。他们为什么不证明呢？因为，这些专家：　不懂什么是进位。　更不懂什么是舍弃进位。－－－－－－－－－－－－－－－－－－－－另外，由补码换算到十进制数，也极其简单。你只需记住：【补码首位的权，是负数】。一般的八位二进制数，各个位的权是：　　128、64、32、16、8、4、2、1；如果是八位的补码，各个位的权则是：　－128、64、32、16、8、4、2、1。　例如，有一个补码：1110 0001，它代表的十进制是：－128 + 64 + 32 + 1= －31。再看，另一个补码：0110 0001，它代表的十进制是：0 + 64 + 32 + 1 = ＋97。仅仅使用【进制转换】，不就完事了！－－－－－－－－－－－－－－－－－－－－－－那么，所谓的：　机器数真值符号位原码反补码正数三码与正数相同　负数取反加一符号位不变符号位也参加运算模同余 ... 这一大堆乱七八糟的概念，不都是垃圾嘛！进位，是小学二年级的知识点吧？　舍弃进位，很难理解吗？　老外竟然能弄出那么大一堆概念！　老外的数学水平，由此可见一斑。谁要是跟老外学算术，立刻、马上，就掉沟里去了！我们的计算机老师，也不懂数学，只知道跟风。　一天一天的，在大学里，兜着圈子讲小学的知识。　真是毁人不倦坑人不浅！这些老师，捡个鞋拔子就当成玉如意了。　天天蒙骗学生，赚取名声和丰厚的讲课费。　　顺便再抓几个学生挂科，抖一下威风！现在知道我们缺芯片用的原因了吧！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。