- 博客(4)
- 收藏
- 关注
翻译 PAC-Baye
PAC(概率近似正确)理论在给定训练集D的情况下,我们希望基于学习算法algorithm学得的模型所对应的假设h尽可能的接近目标概念c.也就是说,以较大的概率学得的误差满足预设上限的模型,这就是“概率”“近似正确”的含义。VC维Poper哲学思想(证伪主义):有一些说法(例如我家车库有条龙)即使无法推翻,也不应该被确证。现在科学界公认的一条黄金定律——一个学说只有具备可证伪性才应该被肯定。 Pope
2017-09-06 10:56:44
1253
原创 多视图学习
多视图学习典型方法 典型相关性分析(CCA) 从整体上把握两组指标之间的相关关系,分别在两组变量中提取有代表性的两个综合变量u和v(分别为两个变量组合中各变量的线性组合),利用这两个综合变量之间的相关关系来反映两组指标之间的整体相关性。 协同训练(co-training) 为验证协同训练的有效性,给出一个PAC分析。PAC 分析是在两个假设条件下进行的: (1)每个视图都足以进行正确的分类(也
2017-09-03 20:56:37
7219
原创 不平衡数据研究
不平衡数据 不平衡数据的处理方法主要有: 数据层面:随机过采样、随机欠采样、综合采样 算法层面:针对不同误分类情况代价的差异进行优化——代价敏感学习、基于Boosting的集成学习 随机过采样——SMOTE算法 该算法通过对少数类样本进行分析,并根据少数类样本人工合成新样本添加到数据集中。 随机欠采样 缺点 传统的不平衡数据学习方法习惯于采用重采样方法来改变不平衡数据集的
2017-08-31 09:09:20
2426
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人