申请过专利的人都知道,到知识产权局的专利检索网站检索的时候速度超级慢,基本上是输入查询条件,去泡杯咖啡,再回来可以看到结果。以前一直不明白为什么会这么慢,上周去一家公司面试,他们所采取的技术实现方式让我明白了专利检索那么慢的愿意了。专利往往涉及全文检索,最好的方式就是使用搜索引擎技术,这一技术在以前还不是被大范围使用的,所以很多系统使用数据库来做这件事。使用数据库之后,为了实现这些数据的全文检索,很多系统使用sql的like来做这件事情。可想而知,这样的查询效率会有多慢,每次检索都成为一次全表扫描。当然,知识产权局还是比较有钱,可以使用昂贵的大型数据库,所以还可以查得出接过来。但是确实速度太慢了,完全没有办法满足实际需要。可以每次检索都可以泡咖啡,甚至喝咖啡了。
要解决这样的问题,最简单的办法,就是部署一个搜索引擎,将信息放到搜索引擎中,这样的检索速度和like查询想比,就是飞一般的速度。
可能有人觉得搜索引擎是一项昂贵而复杂的技术,但是随着solor和es的出现,部署一个中小规模的搜索引擎已经不是困难的事情了,所以有实时性要求的like查询应当被搜索引擎替代了。搜索已经成为一种通用技术,可以在所有涉及全文检索的系统中大量应用。