前言
-
场景
- 根据关键词来判断一个标题属于什么类型的文章 例如
- 《小米雷军用苹果被吐槽,官方回应:不用就是不关心产品》标题里出现 小米和 苹果,则大概率认为该文章的主题是手机,而此处就是要用 算法找出【小米、苹果】这类词及其对应的主题 常用方法
- 基于统计、监督分类模型(贝叶斯…)、半监督、无监督模型(词向量…) 代码+语料+结果
- https://github.com/AryeYellow/NLP/tree/master/classification/word_clf
基于统计
单标签多分类
from collections import Counter
from jieba import cut
def statistics
本文探讨Python在监督学习中的应用,特别是针对词分类任务。涵盖了单标签和多标签多分类的统计方法,以及机器学习算法的应用。文章还提供了全部分析结果的比较,并延伸讨论了半监督词分类算法,旨在通过这种方法找出更多的情感词如‘新鲜’、‘甜’、‘坏’、‘烂’。
订阅专栏 解锁全文
986

被折叠的 条评论
为什么被折叠?



