
开源项目
beifeng600
这个作者很懒,什么都没留下…
展开
-
一些中国优秀开源项目(来自优快云2013年评选)
来自优快云,2013年度中国优秀开源项目评选活动,多谢这些开源软件,让我们学习了很多东西,开发、学习容易了很多。 当时票数有限,只能选择了近期接触的几个开源软件,其他的也有很多好的。开源中国社区 http://www.oschina.net/ 里面也有很多,没事逛逛,学习下。原创 2013-07-02 20:05:11 · 1123 阅读 · 0 评论 -
中文信息处理--分句
中文信息处理--分句 工欲善其事必先利其器。中文信息处理之,中文分句。 按这几个标点“ 。!?…!?”,将中文进行分句,一般会遇到一些问题,比如成对的《》“”‘’{}()()【】"",如果其中包含句的标点,会将完整的一句话拆分成几个句子。 以下是使用Python实现的中文分句程序,可以处理单个文件或者文件夹,但文件编码需为UTF-8, # cod原创 2015-08-24 01:04:50 · 2810 阅读 · 1 评论 -
文本编码检测
工欲善其事必先利其器 -- 文本编码检查 处理文本的时候,经常会遇到各种不同的文件编码。将它们批量转换成同一编码,再批量进行其他操作会方便很多。今天在github上发布了一个 批量检测文件编码的小工具,希望对经常处理文本的朋友有所帮助。并能批量转换编码。用java写的,需要安装java运行环境,建议 JDK 1.7 +地址:https://github.com/beif原创 2015-07-17 08:40:07 · 837 阅读 · 0 评论