
线性模型
文章平均质量分 87
好好学习_rich
好好学习,喜欢数据分析的小姐姐一枚呀!
做笔记的同时提升自己的能力
我只是知识的搬运工,自己比较擅长归纳总结
欢迎大家和我互动呀!!!
展开
-
【时间序列预测2】
接上篇时间序列预测,这篇笔记只是简单的时间序列预测模型和大致流程,作为机器学习的一个学习指导。资料来源kaggle上的课程笔记。原创 2023-02-08 17:13:06 · 178 阅读 · 0 评论 -
【时间序列预测1】
这是一个时间序列预测的笔记,从kaggle比赛的课程归纳而得,讲了时间序列的几大特征:趋势,季节性,周期性。以及使用这些特征来预测模型,讲得非常简单易懂,也是一个比较简单的机器学习案例。原创 2023-02-02 17:25:33 · 2109 阅读 · 3 评论 -
【逻辑回归分类】
本文讲述了逻辑回归的知识,且注意到它是用于分类,可以进行二分类,也可以进行多分类,讲了各种算法,和一个例子。原创 2023-01-07 22:14:12 · 292 阅读 · 0 评论 -
【贝叶斯岭回归】
贝叶斯岭回归是回归模型中的一种概率模型,是机器学习中的一种线性模型。相比普通最小二乘法,贝叶斯岭回归更适合于表现比较差的数据。其正则化参数alpha和gamma的选择对模型效果很重要原创 2023-01-06 16:20:43 · 2427 阅读 · 0 评论 -
Lasso回归
Lasso回归是一种线性模型,该方法是一种压缩估计。它通过构造一个惩罚函数得到一个较为精炼的模型,使得它压缩一些回归系数,即强制系数绝对值之和小于某个固定值;同时设定一些回归系数为0。也是一种处理复共线性数据的有偏估计。本文同时还介绍了其超参数的选择方法——交叉验证和信息准则,一般选择交叉验证方法。原创 2023-01-03 17:37:11 · 5301 阅读 · 0 评论 -
数据分析流程(岭回归模型)
本文讲的岭回归模型,接上一篇。主要讲述了系数的比较一定在同一个范围,可以对它们进行标准化处理;在多重线性模型中,解释变量时是条件独立性,也就是保持其他变量不变;相关性强的特征会导致估计的系数不稳定,以及它们对模型因变量的影响不能区分开;通过交叉验证来检查系数的稳定性。原创 2022-12-29 18:01:56 · 359 阅读 · 0 评论 -
【数据分析流程】
一些数据分析流程总结,先以岭回归为例,包括数据探索,查看数据的分布,相关性分析,有一个小技巧,当出现长尾分布时,可以采用对其取对数的方法,达到正态分布的要求。用one-hot encode处理非二分类的离散型变量。对于分析对比系数的重要性时,一定要把它们的范围划统一才能比较。原创 2022-12-28 22:59:01 · 179 阅读 · 0 评论 -
【最小二乘法估计】
本文介绍两种线性模型,一种线性回归(用最小二乘法估计参数),一种岭回归。岭回归是一种专用于共线性数据分析的有偏估计回归方法。实质上是一种改良的最小二乘估计法,通过放弃最小二乘法的无偏性,以损失部分信息、降低精度为代价获得回归系数更为符合实际、更可靠的回归方法,对病态数据的拟合要强于最小二乘法。原创 2022-12-27 18:42:41 · 1562 阅读 · 0 评论