(NLP学习)(一)引子

最新推荐文章于 2024-09-23 22:02:08 发布

Gavin_ggl

最新推荐文章于 2024-09-23 22:02:08 发布

阅读量282

点赞数

CC 4.0 BY-SA版权

分类专栏： NLP 文章标签： NLP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_41250910/article/details/99580486

NLP 专栏收录该内容

10 篇文章

订阅专栏

引出

机器翻译的变化

以前：基于人工统计的规则来翻译 -> 现在：用机器学习来学习出统计的规则来翻译

之前的机器翻译的缺点：

计算速度慢
语义不通问题
语法错误问题

解决语法问题

例如：翻译“今晚的课程有意思”

在这里插入图片描述
首先，先分词为“今晚/的/课程/有意思”，对应词典里面的对应翻译为“Tonight of the course interesting”，即Broken English。
然后，将所有单词进行排列组合，罗列出所有可能性，然后选出最适合的句子。使用一些模型（或者叫选择器），例如LM（language model语言模型），可以计算出每个句子最优的概率，选择概率最高的句子。

致命的缺点：计算量太大了，单词少可以，单词多了，再阶乘，我的天呐！即，算法复杂度太高。

我们尝试把两个步骤（即两个黄色方框）：Translation model + Language model 合二为一即：Decoding A lgorthm 典型：Viterbi Algorthm（维特比算法），后续会详细讲解。
在这里插入图片描述
NLP设计的应用场景：

机器翻译
问答系统
情感分析
自动提取摘要
聊天机器人
信息抽取

自然语言处理技术的四个维度：

声音->Morpholgy单词->Syntax句子结构->Semantic语义

设计技术算法：

Morpholgy单词：分词，词性标注，NER（命名实体识别）
Syntax句子结构：句法分析，依存分析
Semantic语义：机器学习

在这里插入图片描述
对现有的NLP问题的一个比较好的总结。

博客等级

码龄8年

37
原创

51
点赞

290
收藏

87
粉丝

关注

私信

分类专栏

机器学习 9篇
python 7篇
数据结构 5篇
转载留存 3篇
github 1篇
项目记录 3篇
读书笔记 3篇
NLP 10篇

展开全部收起

上一篇：: （读书笔记）周志华《机器学习》第4章：决策树

下一篇：: (NLP学习)(二)基础储备

最新评论

(项目记录)学者影响力预测（python）
Kkkkkkklalala: 您好，这个后续怎么操作的呀？
(NLP学习)(六)搭建基于检索的问答系统
xiaozhanjun: 这是中文问答还是英文？
(项目记录)学者影响力预测（python）
小红-: 您好想请问一下影响力预测是怎么做的？方便介绍一下吗
(算法理论)动态规划（python）
喝AD钙不啦: 代码不写注释，读了也搞不懂
(算法理论)动态规划（python）
无名程序员就是我: 问题三可以这样解： [code=python] # mine # e.g. [10,9,2,5,3,7,101,18] 4 ls = eval(input()) # print(ls) def find(ls): if len(ls) <= 1: return ls[0] else: x = 0 opts = [] for i in range(len(ls)): y = ls[i] opts.append(ls[i]) for j in range(i,len(ls)): if y < ls[j]: y = ls[j] opts.append(y) ans = len(opts) opts.clear()# 清除 x = max(x,ans) # x = len(list(set(opts))) return x print(find(ls)) [/code]

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。