桌面搜索现在做的比较热,主要有google,百度,雅虎,微软等,中国的有网络猪和88data。用下来感觉还是google的比较不错。
由于手头也有一些这方面的技术,所以想发起一个桌面搜索的项目。
桌面搜索主要的两个问题是搜索引擎和多种文件格式的支持,对于搜索引擎方面,我这里已经有现成的模块。文件格式支持就不是我一个人能做的了的了。现在手头有的技术有office系列,outlook,文本,pdf这些格式。对于其他的格式,想通过一种插件的方式实现,即给一个统一的接口模板,大家都用这个模板开发dll,主程序会自动将这些dll集成进来,遇到特定的格式,调用特定的dll去读取里面的文字内容。
由于现在我这里blog刚开起来,没有多少人关注,所以我先自己把目录监控,主框架搭建,接后方式这些工作完成。格式解析先把我能解决的完成,其他的慢慢来,希望能有越来越多的人参与这个项目,制作出一套完美的桌面引擎出来。