Mysql的全文索引是根据英文的特点来开发,英文“this is my mysql database”,英文可以根据空格和标点符号去分开每个单词,然后统计单词的位置,生成索引树;
然而中文却没有这种特点,只能利用sphinx或者lucence去利用词库,匹配出关键词,然后构建索引树,通过关键词索引树可以直接获取到数据的Id,然后用id去数据库进行查询,直接命中数据库的索引,提升查询效率,而且第三方的全文索引引擎还可以统计关键词的次数,提供相关度查询等功能。
Mysql的全文索引适用于英文环境, 利用空格和标点符号进行单词分割并建立索引树。对于没有明显边界特征的中文,则需借助sphinx或lucene等第三方引擎进行分词处理,构建关键词索引树以提高查询效率。
Mysql的全文索引是根据英文的特点来开发,英文“this is my mysql database”,英文可以根据空格和标点符号去分开每个单词,然后统计单词的位置,生成索引树;
然而中文却没有这种特点,只能利用sphinx或者lucence去利用词库,匹配出关键词,然后构建索引树,通过关键词索引树可以直接获取到数据的Id,然后用id去数据库进行查询,直接命中数据库的索引,提升查询效率,而且第三方的全文索引引擎还可以统计关键词的次数,提供相关度查询等功能。
348
893
4565

被折叠的 条评论
为什么被折叠?