
机器学习
zsyRain
这个作者很懒,什么都没留下…
展开
-
模型的评估方法
模型的评估方法评估思路:通过实验测试,对模型的泛化误差进行评估,选出泛化误差最小的模型。待测数据集全集未知,使用测试集进行泛化测试,测试误差(Testing Error)即为泛化误差的近似。留出法留出法(Hold-out):将已知数据集分成两个互斥的部分,其中一部分用来训练模型,另一部分用来测试模型,评估其误差,作为泛化误差的估计。 两个数据集的划分要尽可能保持数据...原创 2019-08-20 11:50:04 · 962 阅读 · 0 评论 -
模型的性能度量
性能度量(Performance Measure):评价模型泛化能力的标准。对于不同的模型,有不同的评价标准,不同的评价标准将导致不同的评价结果。模型的好坏是相对的,取决于对于当前任务需求的完成情况。回归模型的性能度量通常选用均方误差(Mean Squared Error)。分类算法常用的性能度量:聚类算法的性能度量:...原创 2019-08-20 12:33:15 · 331 阅读 · 0 评论 -
比较检验
模型比较选择合适的评估方法和相应的性能度量,计算出性能度量后直接比较。存在以下问题:模型评估得到的是测试集上的性能,并非严格意义上的泛化性能,两者并不完全相同测试集上的性能与样本选取关系很大,不同的划分,测试结果会不同,比较缺乏稳定性很多模型本身有随机性,即使参数和数据集相同,其运行结果也存在差异假设检验统计假设检验(Hypothesis Tset):事先对总体...原创 2019-08-20 18:22:49 · 1036 阅读 · 0 评论 -
方差和偏差
偏差、方差与噪声偏差(Bias):描述的是根据样本拟合出的模型的输出预测结果的期望与样本真实结果的差距,即在样本上拟合的好不好。方差(Variance):模型每次输出结果与模型输出期望之间的误差,即模型的稳定性。噪声(Noise):为真实标记与数据集中的实际标记间的偏差,通常由多种因素综合影响造成,不可去除。偏差度量了学习算法的期望预测与真实结果的偏离程度,刻画了学习算法本身的拟合...原创 2019-08-20 18:46:24 · 289 阅读 · 0 评论 -
回归分析
原创 2019-08-20 18:55:56 · 170 阅读 · 0 评论 -
什么是线性回归分析
变量之间的非严格函数关系变量之间X、Y之间存在某种密切的联系,但并非严格的函数关系(非确定性关系)。回归回归是处理两个或两个以上变量之间互相依赖的定量关系的一种统计方法和技术,变量之间的关系并非确定的函数关系,通过一定的概率分布来描述。线性与非线性线性(Linear)的严格定义是一种映射关系,其映射关系满足可加性和其次性。通俗理解就是两个变量之间存在一次方函数关系,在平...原创 2019-08-20 19:12:11 · 2986 阅读 · 0 评论