分词
MaxChanger
欢迎各位大牛交流指正,本人对ROS操作、机器人导航略有涉略,使用Windows和Ubuntu两个系统,并且对电脑日常出现的小问题和使用的小技巧有一定总结。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
中文分词之HMM模型详解
关于HMM模型的介绍,网上的资料已经烂大街,但是大部分都是在背书背公式,本文在此针对HMM模型在中文分词中的应用,讲讲实现原理。尽可能的撇开公式,撇开推导。结合实际开源代码作为例子,争取做到雅俗共赏,童叟无欺。没有公式,就没有伤害。模型介绍第一次听说HMM模型是从李开复的博文论文中听说的:李开复1988年的博士论文发表了第一个基于隐马尔科夫模型(HMM)的语音识别系统Sphi转载 2018-02-01 18:52:42 · 810 阅读 · 0 评论 -
jieba分词学习记录
jieba分词分词import jiebastr = '贾跃亭来到北京清华大学'a = jieba.cut(str,cut_all=False,HMM=True)b = jieba.cut(str,cut_all=True ,HMM=True) # cut_all=True 全模式c = jieba.cut(str,cut_all=False,HMM=False)d原创 2018-02-01 21:57:15 · 1181 阅读 · 1 评论 -
分词TextRank算法解读
利用计算机将大量的文本进行处理,产生简洁、精炼内容的过程就是文本摘要,人们可通过阅读摘要来把握文本主要内容,这不仅大大节省时间,更提高阅读效率。但人工摘要耗时又耗力,已不能满足日益增长的信息需求,因此借助计算机进行文本处理的自动文摘应运而生。近年来,自动文摘、信息检索、信息过滤、机器识别、等研究已成为了人们关注的热点。自动文摘(Automatic Summarization)的方法主要原创 2018-02-01 22:25:58 · 3624 阅读 · 0 评论
分享