- 博客(6)
- 资源 (3)
- 收藏
- 关注
原创 NB朴素贝叶斯进行中文文本分类
基于multinomial-nb的文本分类文章目录基于multinomial-nb的文本分类一、数据处理1. 数据获取2. 数据预处理二、离散型朴素贝叶斯——multinomial-nb算法1. 文本识别中的NB2. 训练朴素贝叶斯分类器2.1 先验概率P(c)的计算2.2 **似然函数P(wi|c)的计算**3. ==代码实现==3.1 执行函数3.2 fit()训练3.3 buildGlobalVocab(self) 建立全部词库3.4 cleanDoc() 分离文档中的词语3.5 countCls(
2021-10-02 20:44:19
1445
原创 CRF条件随机场进行中文文本分词
文章目录一、问题分析1.CRF简述与对比2.分析3. 构建特征函数4.维特比算法二、算法实现三、结果展示四、总结1.模型2.算法3.策略五、源码一、问题分析1.CRF简述与对比CRF分词原理CRF把分词当做字的词位分类问题,通常定义字的词位信息如下:词首,常用B表示词中,常用I表示词尾,常用E表示单子词,常用S表示CRF分词的过程就是对词位标注后,将B和E之间的字,以及S单字构成分词CRF分词实例:原始例句:我爱北京天安门CRF标注后:我/S 爱/S 北/B 京/E
2021-10-02 20:37:10
1851
3
原创 HMM隐马尔可夫模型进行中文文本分词
文章目录一、HMM简述1.引入2.隐马尔科夫模型(1)定义(Definition of a hidden Markov model)(2)应用3.前向算法(了解)4. 维特比算法5.前向-后向算法(了解)二、使用HMM进行文本分类1.问题分析2. 代码流程三、总结1.模型2.算法三、总结1.模型2.算法四、源码一、HMM简述1.引入民间传说告诉我们水藻的状态与天气状态有一定的概率关系——天气和水藻的状态是紧密相关的。在这个例子中我们有两组状态,观察的状态(水藻的状态)和隐藏的状态(天气的状态)。
2021-10-02 20:25:12
3463
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人