
机器学习
文章平均质量分 65
开挖掘机的
这个作者很懒,什么都没留下…
展开
-
AdaBoost算法和java实现
AdaBoost算法和java实现算法描述输入:训练数据集,其中xix_{i}∈\inχ\chi⊆\subseteqRnR^{n},yiy_{i}∈\in{-1,+1};弱学习算法; 输出:最终分类器G(x)。初始化训练集数据的权值分布 D1D_{1}=(w11w_{11},…,wiNw_{iN}), w1iw_{1i}=1/N, i=1,2…,N对m=1,2,原创 2015-08-04 15:38:57 · 2437 阅读 · 0 评论 -
处理非均衡问题的数据抽样方法
针对分均衡问题的调节分类器的方法就是分裂期的训练数据进行改造。这可以通过欠抽样或者过抽样来实现。过抽样意味着复制样例,而欠抽样意味着删除样例。不管采用哪种方式,数据都会从原始形式改造为新形势。抽样过程则可以通过随机方式或者某个预定的方式来实现。 通常也会存在某个罕见的类别需要我们来识别,比如在信用卡欺诈当中。正例类别属于罕见类别(因为被欺诈的毕竟是很少的一个部分),我们希望对于这种罕见类别能尽可能原创 2015-09-21 10:45:25 · 1433 阅读 · 0 评论 -
Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱
转载:我爱自然语言处理 曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工作中的第一辅助脚本语言,虽然开发语言是C/C++,但平时的很多文本数据处理任务都交给了Python。离开腾讯创业后,第一个作品课程图谱也 是选择了Python系的Flask框架,渐渐的将自己的绝大部分工作交给了Python。这些年来,接触和使用了很多Python工具包,特别是在文本 处理,科学计算,机器学习和数据挖原创 2015-10-28 15:56:04 · 1042 阅读 · 0 评论