
NLP自然语言处理
皮卡丘的忧伤
这个作者很懒,什么都没留下…
展开
-
【自然语言处理基础技能(NLP)】语言模型基础
【自然语言处理基础技能(NLP)】语言模型基础目录1. 引言:朴素贝叶斯的局限性2. N-gram语言模型是啥?2.1从假设性独立到联合概率链规则2.2 从联合概率链规则到n-gram语言模型2.3 怎样选择依赖词的个数"n"?3. N-gram实际应用举例3.1 词性标注3.2 垃圾邮件识别3.3 中文分词3.4机器翻译与语音识别4. 平滑技术...原创 2019-11-15 17:08:00 · 1083 阅读 · 0 评论 -
【自然语言处理基础技能(NLP)】朴素贝叶斯
朴素贝叶斯目录:1. 引言2. 贝叶斯公式3. 用机器学习的视角理解贝叶斯公式4. 垃圾邮件识别5. 分词6. 条件独立假设7. 朴素贝叶斯(Naive Bayes),“Naive”在何处?8. 简单高效,吊丝逆袭9.处理重复词语的三种方式 9.1多项式模型 9.2伯努利模型 9.3.混合模型10.去除停用词与选择关键词...原创 2019-11-14 22:56:07 · 2090 阅读 · 0 评论 -
【自然语言处理基础技能(NLP)】jieba中文文本处理
1.基本分词函数与用法# jieba.cut 以及 jieba.cut_for_search 返回的结构都是一个可迭代的 generator,可以使用 for 循环来获得分词后得到的每一个词语(unicode)# # jieba.cut 方法接受三个输入参数:# # 需要分词的字符串# cut_all 参数用来控制是否采用全模式# HMM 参数用来控制是否使用 HMM 模型# ...原创 2019-11-10 16:26:32 · 6745 阅读 · 4 评论 -
【自然语言处理基础技能(NLP)】python正则表达式
正则表达式规则表:正则表达式测试连接 :http://regexr.com/进阶练习:https://alf.nu/RegexGolfpython 【re模块】s = 'ABC\\-001' # Python的字符串# 对应的正则表达式字符串变成:# 'ABC\-001'#建议使用Python的r前缀,就不用考虑转义的问题了:s = r'ABC\-001'...原创 2019-10-26 14:21:09 · 596 阅读 · 0 评论 -
NLP【自然语言处理】技术路线
自然语言处理 NLP1. 数学基础........................................................................................................... 31.1. 线性代数.........................................原创 2019-10-22 12:41:33 · 8282 阅读 · 0 评论