支持向量机与神经网络在情感分类和模式识别中的应用
1. CorpusSet 类的定义与实现
在情感分析的应用中,我们需要将多个语料库对象整合在一起,这就引入了 CorpusSet 类。该类主要负责两项任务:
- 合并两个语料库对象 :将不同的语料库对象合并成一个集合。
- 构建与情感分类器关联的稀疏向量 :将语料库中的文本信息转换为支持向量机(SVM)可以使用的向量形式。
1.1 合并两个语料库对象
以下是一个测试用例,展示了如何将两个 Corpus 对象合并到一个 CorpusSet 类中:
# test/lib/corpus_set_spec.rb
require 'spec_helper'
describe CorpusSet do
let(:positive) { StringIO.new('I love this country') }
let(:negative) { StringIO.new('I hate this man') }
let(:positive_corp) { Corpus.new(positive, :positive) }
let(:negative_corp) { Corpus.new(negative, :negative) }
let(:corpus_set) { CorpusSet.new([positive_corp, negative_corp]) }
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



