Stanfordcorenlp的安装

1:下载安装JDK 1.8及以上版本。
2:下载Stanford CoreNLP文件,解压。
3:处理中文还需要下载中文的模型jar文件,然后放到stanford-corenlp-full-2018-02-27根目录下即可(注意一定要下载这个文件,否则它默认是按英文来处理的,无法处理中文语言)。
使用
Python调用StanfordCoreNLP的使用方法:
使用pip安装stanfordcorenlp
简单使用命令:pip install stanfordcorenlp
在Python环境下调用stanfordcorenlp:
一般建议,实际运用时,通常需要做词性分析的数据集都较大,所以给出以下两种导入数据的方式供参考。
1:测试数据较短时,通常采用直接导入,如:

2:测试数据较大,且数据间规范化程度不够,噪声大,此时需要直接将整个未经处理的数据集直接导入且不影响接下来的数据处理(与原数据一致)。通常采用pandas来读取大数据集(常是.csv格式的),如:
引入pandas中dataframe这一主要数据结构来导入数据,如图中的训练集sample.csv,是一个有200个用户对餐厅评价的一个训练集,通过将sample.csv放到程序编辑的目录中即可不用寻找路径直接录入该训练集文件,今

本文介绍了如何在Python环境下安装和使用StanfordCoreNLP处理中文数据,强调了词性分析和依存句法分析在大型数据集上的应用,特别是对于评论分析的重要性。
最低0.47元/天 解锁文章
220

被折叠的 条评论
为什么被折叠?



