
机器学习
文章平均质量分 63
守望拼搏
计算机行业的小角色
展开
-
theano卷积神经网络-场景
theano卷积神经网络用于图片的场景分类研究原创 2015-05-17 00:06:03 · 630 阅读 · 0 评论 -
特征选择[转载,翻译]
问题描述:进行模型训练时,特征数据必不可少,但是特征数量、特征质量如何,对模型效果起着十分关键的作用。有时候特征维度很高但是有很多特征对模型效果提升是无益的,甚至在有的模型中特征之间还会进行干扰。此时特征选择是十分必要的,通过特征选择选取最优特征子集能达到提高模型训练速率和模型效果的目的。特征选择流程:进行特征选择时,需要生成特征子集,确定好评价函数(模型效果是否变优),停止准则(什么转载 2015-08-26 14:25:22 · 827 阅读 · 0 评论 -
不平衡分类问题处理方法
问题描述:工作中处理分类问题时,很多情况是多个分类类别的数据分布不平衡,有的类别的数据量可能远小于其他类别。并且在实验中发现,进行分类模型训练时,各类别的数据比例不同对最终模型分类效果的影响很大。解决方法:对于这类问题,主要从数据和学习两个角度进行处理。训练集大小,类优先级,误分代价几个重要影响因素需要重点处理。从数据角度:训练集重采样,训练集划分;从学习算法角度:分类器集成,原创 2015-08-21 11:24:04 · 1661 阅读 · 0 评论