近期工作安排

针对一个高精度文本分类需求,本文介绍了从KNN分类器的实现到考虑采用bagging、boosting及半监督学习等方法提升分类效果的技术路径。

目前参与到了实验室的某一个项目中的子需求中。这个子需求可以归结为一个文本分类问题,但是对文本分类精度的要求非常高。所有考虑做如下工作:

1。 程序中实现KNN分类器或者多项式朴素贝叶斯分类器。(调用weka的分类器不太方便,还是自己直接写。毕竟这是做工程,而不是做“实验”)

目前已经完成了KNN分类器

2。考虑用bagging或者boosting的方法加强基本分类器的性能。或者通俗点说是用“串联”或者“并联”分类器的方法,提供分类性能。

3。考虑用半监督学习方法中的“使用朴素贝叶斯分类器的EM算法”来提供分类性能。

真想做个实验,看看1,2,3那种方法更好,就是不知道boss是不是会不给我时间,只是草草地完成工程就OK了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值