本文为自己学习的记录,仅供大家参考。
具体分析见代码注释
本文语料为京东商城的商品评价,语料文件下载地址:https://pan.baidu.com/s/1kV5pAHx,提取码:ct5m,其中merge.txt为已经经过切词和去停词处理的文件。
-*- coding: utf-8 -*-
from sklearn.cross_validation import train_test_split
from sklearn.naive_bayes import MultinomialNB
from sklearn.linear_model import LogisticRegression
from sklearn.svm import SVC
from sklearn.feature_extraction.text import TfidfVectorizer
from BaseUltils import loadData