自然语言处理总复习(八)—— 文本分类 一、相关概念和介绍(一)分类技术在自然语言中的应用(二)文本分类的一般过程1. 一些名词2. 分类过程展示 二、分类方法(一)朴素贝叶斯分类1. 假设2. 参数计算3. 算法(训练)4. 举例5. 讨论 (二)K近邻1. 介绍2. 算法3. KNN中的相似度量4. 图示 (三)决策树分类和最大熵分类(四)支持向量机分类 一、相关概念和介绍 (一)分类技术在自然语言中的应用 (二)文本分类的一般过程 1. 一些名词 训练集数学模型训练过程测试集评价 2. 分类过程展示 二、分类方法 (一)朴素贝叶斯分类 1. 假设 2. 参数计算 3. 算法(训练) 4. 举例 5. 讨论 (二)K近邻 1. 介绍 2. 算法 3. KNN中的相似度量 最简单的是欧式距离最常用的还是用TF-IDF 计算权重,用Cosine计算相似度的方法 4. 图示 (三)决策树分类和最大熵分类 (四)支持向量机分类