
01_传统机器学习
文章平均质量分 80
个人学习机器学习的记录、总结、思考
Cosmos Tan
无冥冥之志者,无昭昭之明。
无惛惛之事者,无赫赫之功。
展开
-
线性回归学习总结
线性此外在回归分析中,会有残差和均方误差两个词。其中残差是预测值和观测值(真实标签)之差。SSE 表示的是残差平方和(Sum of Squares for Error),也称为误差平方和。MSE 表示均方误差(Mean Squared Error)均方误差是残差平方和除以样本数量的结果,表示了每个样本的预测误差的平方的平均值数学上的误差(相对误差和绝对误差)是实际测量值和真实值(理论值)之前的差别。统计学上,方差是衡量数据的离散程度的,而偏差描述的是预测值(估计值)的期望与真实值之间的差距。原创 2023-08-12 00:08:47 · 876 阅读 · 0 评论 -
Sklearn学习记录之CountVectorizer
在sklearn.feature_extraction.text中有四个用来从文本中提出特征向量的子模块,其中以CountVectorizer为基础模块。其模块的主要函数是fit 和transformer。以下截图是具体的源码。在文本处理过程中,先挖坑,有时间再填。原创 2022-10-07 16:07:11 · 573 阅读 · 0 评论