【文本意图分类】是怎么实现的

最新推荐文章于 2023-09-17 18:30:00 发布

南七小僧

最新推荐文章于 2023-09-17 18:30:00 发布

阅读量1k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：人工智能与深度学习算法研究机器学习人工智能

我是南七小僧，邮箱：xkk9866@yeah.net ，C9博士，前百度搜索AI平台产品负责人，欢迎交流思想碰撞。

本文链接：https://blog.youkuaiyun.com/qq_25439417/article/details/82589918

242 篇文章 ¥19.90 ¥99.00

订阅专栏

91 篇文章 ¥19.90 ¥99.00

订阅专栏

43 篇文章 ¥19.90 ¥99.00

订阅专栏

本文介绍了文本意图分类的实现过程，包括数据准备、特征提取、模型准备和训练模型。通过将每个字作为特征，利用字的频率作为权值，构建分类模型。模型根据句子中字的特征得分进行相加，确定句子所属类别，以提高语料匹配效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

之前开始做语义理解的时候，笔者采用的是比较粗暴的方法进行匹配。随着语料的积累，语料库的规模变得越来越大，匹配的效率也随着越来越低，对语料进行意图分类的想法也就随着产生。

当用户输入之后，系统首先对输入进行意图分类，然后对分类下的语料进行匹配，从而减轻计算量，提高系统的匹配效率。

本文只是简单的阐述一下意图分析的典型思路和方法，并实现一个基本的意图分类器，而无意系统的探究意图分类。更详细的探讨后文再进行。

本文按照如下流程进行叙述：

假设有3个场景：吃饭、打招呼、再见。那么三个场景下会有什么样的对话呢？
比如：

很明显，人眼一看就能看出对应的句子应该是哪个类别了：

到这里，我们模型需要的数据就有了。可以很清晰的写出下面的代码：

list_sen=['今天这个菜真好吃！','嗨！今天天气不错！','今天很开心，明天见！']

需要的数据就有了，下一步是提取特征。

了解本专栏