一、什么是Lucence:
是java的一个全文检索的引擎框架框架,可以像jbpm工作流一样,嵌入到各种应用系统中,提供检索的功能。
二、数据处理概览:
结构化数据:
具有固定长度、固定格式:sql、mysql、Oracle处理的数据。
非结构化数据:
没有固定的格式、长度:Word、邮件等
半结构化数据:
xml、html等,可以抽离出后,按照结构化数据处理。
因为关系数据具有稳定结构的关系,所以,可以统一进行管理,而且
Lucene是Java的全文检索引擎框架,常用于嵌入式应用系统中提供检索功能。它能处理结构化、非结构化和半结构化数据,并通过建立索引来提升检索速度。MongoDB则侧重于大型文件的管理,而Lucene基于索引进行检索。Lucene的核心概念包括索引管理和分词器。未来将从代码层面深入学习Lucene。
一、什么是Lucence:
是java的一个全文检索的引擎框架框架,可以像jbpm工作流一样,嵌入到各种应用系统中,提供检索的功能。
二、数据处理概览:
结构化数据:
具有固定长度、固定格式:sql、mysql、Oracle处理的数据。
非结构化数据:
没有固定的格式、长度:Word、邮件等
半结构化数据:
xml、html等,可以抽离出后,按照结构化数据处理。
因为关系数据具有稳定结构的关系,所以,可以统一进行管理,而且
5361
361
6147
——基本原理&spm=1001.2101.3001.5002&articleId=27705185&d=1&t=3&u=3f9e6d771a42495c8805404e4619211c)