情感极性分析
目前,为了增强我们学生的动手能力,老师组织我们参加了一场百度点石的练习赛,这是一场有着NLP背景的多分类问题, 搜集一些资料后,笔者拼来拼去,终于初步完成,目前f1得分为0.9066(未做优化),现在特来分享一下,由于笔者还是初学者,有些解释不好的地方请多多包涵。
训练集测试集下载链接:https://pan.baidu.com/s/1u2YLIW4XYPQjw2qcG63WUg
密码:1mgf
接下来上代码
先导入我们需要用到的库,如果安装库过程有问题可以参考关于jupyter安装第三方库的问题(Linux)
from gensim.models.word2vec import Word2Vec
from sklearn.model_selection import train_test_split
import pandas as pd
import numpy as np
import jieba
from sklearn.externals import joblib
from sklearn.svm import SVC
接着读取我们的文件
columns = ['id', 'type'