【清华NLP】刘知远团队大模型公开课全网首发|带你从入门到实战_哔哩哔哩_bilibili
图灵测试:imitation Game 模仿游戏


Part of speech tagging 词性标注
Named entity recognition : 命名实体的识别
Co-reference:共指消解 (代词)
Basic dependencies:句法关系
中文的自动分词。
-------------------------------------------
Machine Reading 机器阅读是一种利用算法使计算机理解文章语义并回答相关问题的技术,属于自然语言处理的范畴。机器阅读理解的目标是利用人工智能技术,使计算机具有和人类一样理解文章的能力。基于深度学习的机器阅读理解模型经过多年的实践和探索,逐渐形成了稳定的框架结构。
情感分类 意见挖掘
---------------------------
词表示 机器理解词的意思
计算词的相似度,语义关系

用一组词表示相关词


新的词义
数据稀疏的问题


One-Hot Representation










语言模型
词的序列 的联合概率
预测下一个词


一个句子的联合概率=条件概率之积
N-gram Model
4-gram 前面3个词 后面出现词的概率时多少














交叉熵



梯度下降法










CBOW

one-hot向量

softmax?

负例采样



清华大学刘知远团队的OpenBMB大模型公开课发布,涵盖词性标注、命名实体识别等NLP技术。机器阅读理解利用深度学习发展出稳定框架,涉及情感分类和词表示,如词相似度计算及语言模型预测。

被折叠的 条评论
为什么被折叠?



