sphinx全文检索
(1)全文检索简介
1.1 数据分类
生活中的数据总体分为
①.结构化数据: 指具有固定格式或有限长度的数据,如数据库(int char),元数据等。
②.非结构化数据: 指没有固定格式或不定长的数据。如文本文档,text型数据,varchar型数据,word文档等。
非结构化数据还有一种叫法:全文数据
1.2搜索的分类
按数据的分类,搜索也分为两种:
①.对结构化数据的搜索:如SQL语句、文件名的搜索
②.对非结构化数据的搜索:linux下的grep,对文章关键字的搜索。
对非结构化数据的搜索也叫对全文数据的搜索,即全文搜索。
1.3 全文搜索的方法
①.顺序扫描:如要找的内容包含某个字符串,会一个文档一个文档的从头到尾的找,