舆情系统的分词算法(TextAnalysize)往往是系统的核心,通常都是某博士牵头搞的东西。目前汉语最强的是中科院张华平博士的ICTCLAS系统,主要基于隐马尔可夫模型(HMM)。以下是一些信息参考:
ICTCLAS分词系统研究(一)~(五)
http://blog.youkuaiyun.com/sinboy/article/details/622596
ICTCLAS安装
http://blog.sina.com.cn/s/blog_642c9bdd0100wdnm.html
HMM介绍
http://blog.youkuaiyun.com/v_july_v/article/details/7577684
张华平介绍
ICTCLAS分词系统研究(一)~(五)
http://blog.youkuaiyun.com/sinboy/article/details/622596
ICTCLAS安装
http://blog.sina.com.cn/s/blog_642c9bdd0100wdnm.html
HMM介绍
http://blog.youkuaiyun.com/v_july_v/article/details/7577684
张华平介绍
http://baike.baidu.com/link?url=vcvNr1t9hEg1Ehxnq3uWTiYNz1d_7MYMSVyMEYmRCxub8BipkSRvd_TSa9saJ8Fp5VGUjoOmwWJabQd8CGWzCeG8DP8ytVBNQbNgfpU6sSa
一个舆情漂亮报表例子
http://eefung.com/hot-report