自然语言处理基础知识 学习

清华大学刘知远团队的OpenBMB大模型公开课发布,涵盖词性标注、命名实体识别等NLP技术。机器阅读理解利用深度学习发展出稳定框架,涉及情感分类和词表示,如词相似度计算及语言模型预测。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

参考:OpenBMB - 让大模型飞入千家万户

【清华NLP】刘知远团队大模型公开课全网首发|带你从入门到实战_哔哩哔哩_bilibili

图灵测试:imitation Game 模仿游戏

Part of speech tagging  词性标注

Named entity recognition : 命名实体的识别

Co-reference:共指消解  (代词)

Basic dependencies:句法关系

中文的自动分词。

-------------------------------------------

Machine Reading  机器阅读是一种利用算法使计算机理解文章语义并回答相关问题的技术,属于自然语言处理的范畴。机器阅读理解的目标是利用人工智能技术,使计算机具有和人类一样理解文章的能力。基于深度学习的机器阅读理解模型经过多年的实践和探索,逐渐形成了稳定的框架结构。

情感分类 意见挖掘

---------------------------

词表示 机器理解词的意思

计算词的相似度,语义关系

用一组词表示相关词

新的词义

数据稀疏的问题

One-Hot Representation 

语言模型

词的序列 的联合概率

预测下一个词

一个句子的联合概率=条件概率之积

N-gram Model

4-gram  前面3个词 后面出现词的概率时多少

交叉熵

梯度下降法

CBOW

one-hot向量

softmax?

负例采样

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值