本质是分类任务,多用在搜索引擎和智能问答中。
解决方法
1、基于词典以及模板的规则方法
核心是领域词典的构建程度,词典足够好,覆盖范围广,匹配更准确。每一个领域都有自己的词典,如电影、书籍、歌曲;一个query分配给上述三个领域其中之一,最高的匹配度和重合度就是结果。
2、基于机器学习模型来对用户的意图进行判别
标注语料应用ML或者DL训练模型进行测试。
应用fasttext进行文本分类。
本质是分类任务,多用在搜索引擎和智能问答中。
解决方法
1、基于词典以及模板的规则方法
核心是领域词典的构建程度,词典足够好,覆盖范围广,匹配更准确。每一个领域都有自己的词典,如电影、书籍、歌曲;一个query分配给上述三个领域其中之一,最高的匹配度和重合度就是结果。
2、基于机器学习模型来对用户的意图进行判别
标注语料应用ML或者DL训练模型进行测试。
应用fasttext进行文本分类。
您可能感兴趣的与本文相关的镜像
Langchain-Chatchat
Langchain-Chatchat 是一个基于 ChatGLM 等大语言模型和 Langchain 应用框架实现的开源项目,旨在构建一个可以离线部署的本地知识库问答系统。它通过检索增强生成 (RAG) 的方法,让用户能够以自然语言与本地文件、数据库或搜索引擎进行交互,并支持多种大模型和向量数据库的集成,以及提供 WebUI 和 API 服务
8465
1万+

被折叠的 条评论
为什么被折叠?