
文本分类
侠客儿青争ing
这个作者很懒,什么都没留下…
展开
-
文本分类ML
import pandas as pdimport osos.chdir(r'C:\Users\lujing\Desktop\NLP两周实践')train=pd.read_csv('train_set.csv',sep='\t')train.shape(200000, 2)train.head(10) label text 0 2 2967 6758 339 202原创 2020-07-24 22:26:49 · 823 阅读 · 0 评论 -
NLP_代码表示文本向量
第一种表示方式 Count 次数from sklearn.feature_extraction.text import CountVectorizercorpus = [ 'This is the first document . ', 'this document is the second document.', 'the last one']vectorizer = CountVectorizer()vectorizer.fit_transform(corpus)原创 2020-07-23 15:12:23 · 281 阅读 · 0 评论 -
文本分类_打卡2_数据分析
import pandas as pdimport osos.chdir(r'C:\Users\lujing\Desktop\NLP两周实践')train=pd.read_csv('train_set.csv',sep='\t')train.shape(200000, 2)train.head(10) label text 0 2 2967 6758 339 202原创 2020-07-22 16:14:39 · 166 阅读 · 0 评论