前几天,公司的几个华科的实习生他们做文本挖掘的项目,说啥Word2vec啥的,好像是做文本分析、分词啥的吧。
今天无意间在网上发现了这个好东西:语意分析系统,可以快速对文本进行分析。
简介
NLPIR是一套专门针对原始文本集进行处理和加工的软件,提供了中间件处理效果的可视化展示,也可以作为小规模数据的处理加工工具。用户可以使用该软件对自己的数据进行处理。NLPIR分词系统前身为2000年发布的ICTCLAS词法分析系统,从2009年开始,为了和以前工作进行大的区隔,并推广NLPIR自然语言处理与信息检索共享平台,调整命名为NLPIR分词系统。NLPIR 系统支持多种编码(GBK 编码、UTF8 编码、BIG5 编码)、多种操作系统(Windows, Linux, FreeBSD 等所有主流操作系统)、多种开发语言与平台(包括:C/C++/C#,Java,Python,Hadoop 等)。
NLPIR工程包简介
License--一个月的授权文件;如果发生授权过期的情况,可以在此目录下下载更新。NLPIR_Demo--组件功能演示demo(NLPIR大数据搜索与挖掘共享开发平台)NLPIR_SDK--13个组件包,提供了用于技术二次开发的基础工具集,各个组件API可以无缝地融合到客户的各类复杂应用系统之中,可兼容Windows,Linux, Android,Maemo5, FreeBSD等不同操作系统平台,可以供Java,C,C#等各类开发语言使用。
功能介绍
NLPIR大数据搜索与挖掘共享开发平