最近参加一个中文文本实体识别的比赛,于是重拾R语言文本处理的过程,一年前使用过的代码,突然发现现在重新运行一遍会有这个问题,
上网搜索了一遍还是没解决,后来想想归根到底还是编码问题,可能19年对中文编码比较严格一点?
过程如下:
#0.加载各种包
library(rJava);library(Rwordseg);library(NLP);library(tm);
最近参加一个中文文本实体识别的比赛,于是重拾R语言文本处理的过程,一年前使用过的代码,突然发现现在重新运行一遍会有这个问题,
上网搜索了一遍还是没解决,后来想想归根到底还是编码问题,可能19年对中文编码比较严格一点?
过程如下:
#0.加载各种包
library(rJava);library(Rwordseg);library(NLP);library(tm);