监督学习与特征工程:从分类到特征优化
1. 监督学习中的支持向量机(SVM)
1.1 SVM在自然语言处理中的应用
SVM在自然语言处理领域有诸多应用,如词性标注和结构处理。SVMTool是用于顺序词性标注器的有效生成器的开源工具,能为给定的单词序列标注适当的词性。SVMstruct则是用于自然语言处理应用的另一个开源工具,支持SVMcfg(用于上下文无关语法)、SVMmulticlass(用于多类分类问题)和SVMhmm(利用马尔可夫模型的特征)等任务。
1.2 SVM在其他领域的应用
- 癌症预测 :在过去二十年中,机器学习方法广泛应用于疾病预测,SVM在生物信息学领域,如基因分类、蛋白质分类和医学诊断中被广泛使用。SVM分类器可根据肿瘤大小和基因表达将肿瘤分为良性或恶性,还可用于癌症复发和预后预测。可使用临床病理学、临床基因表达和临床基因组等各种类型的数据来训练和测试模型。
- 股票市场预测 :在金融领域,机器学习方法产生了重大影响。股票预测的目标是根据当前股票价格判断近期股票价值的高低,预测可以是短期或长期的。股票市场预测是一个非线性时间序列模型,因为预测不确定且依赖于各种外部因素,因此非线性SVM适用于股票市场预测。Google finance Python是可用于股票预测的开源数据。
- 蛋白质结构预测 :在生物信息学中,蛋白质结构预测在疾病诊断和药物生产中起着重要作用。蛋白质结构分类数据库(SCOP)用于蛋白质分类,由四个蛋白质结构域类别组成:全α、全β、α/β和α+β。SVM能对这四类问题进
超级会员免费看
订阅专栏 解锁全文

673

被折叠的 条评论
为什么被折叠?



