
数据挖掘
文章平均质量分 55
eaglet
这个作者很懒,什么都没留下…
展开
-
如何确定中文字符串的相似度
如何确定中文字符串的相似度 作者:肖波个人博客:http://blog.youkuaiyun.com/eagletEmail:blog.eaglet@gmail.com2007/4 南京 摘要在数据挖掘的研究中,我们往往需要判断文章是否雷同,对类似文章或短句进行归类处理等,这其中就会遇到这样的问题:如何确定两个字符串之间的相似程度。本文综合作者的实际工作经验和数据挖掘理论,原创 2007-04-28 15:22:00 · 5557 阅读 · 8 评论 -
用一行程序去除全文中连续的空格和空行
处理全文时我们经常需要对全文进行一定的压缩,去除全文中连续出现的空格 ,空行以及Tab。当然我们可以写一个程序对全文进行分析判断,达到我们所希望的效果。本文介绍的方法只需一行程序就可以达到去除两个以上连续空格和空行的效果。程序如下using System.Text.RegularExpressions; String inputStr = "xxx /r/n原创 2007-05-05 09:38:00 · 2260 阅读 · 6 评论 -
Hubble.Net 全文数据库开源项目
Hubble.Net 全文数据库开源项目 项目简介Hubble.Net 全文数据库开源项目是一个建立在 .net 框架基础上的由中国程序员主导的全文数据检索开源项目。项目旨在为全文检索开发者或用户提供一个简单易用、高性能、高可用性的全文数据库中间件。Hubble.Net的骨干版本提供最基本的全文检索接口和界面,并被设计为高度可扩展的系统架构,以吸引众多的开发者参与进系统扩展功能的研发和原创 2008-10-30 06:40:00 · 2527 阅读 · 0 评论