完整代码:https://github.com/9ayhub/nlp-search-engine
题目

拼写检查
参考 http://norvig.com/spell-correct.html 和 https://github.com/beyondacm/Autochecker4Chinese
倒排索引
参考 https://blog.youkuaiyun.com/xn4545945/article/details/8791484
文档排序
使用TF/IDF,参考课件


本文介绍了一个使用Python实现的NLP搜索引擎,包括拼写检查、倒排索引和文档排序功能。通过TF-IDF进行文档排序,并在搜索过程中自动纠正错别字。初始化耗时约4~6秒,搜索效率高,能快速处理包含错别字的复杂查询。
完整代码:https://github.com/9ayhub/nlp-search-engine

参考 http://norvig.com/spell-correct.html 和 https://github.com/beyondacm/Autochecker4Chinese
参考 https://blog.youkuaiyun.com/xn4545945/article/details/8791484
使用TF/IDF,参考课件


826
697

被折叠的 条评论
为什么被折叠?