
NLP
威士忌燕麦拿铁
SLAM小白一枚
展开
-
CS224N笔记 Lecture12 Subword Models
0 大纲A tiny bit of linguisticsPurely character-level modelsSubword-models: Byte Pair Encoding and friendsHybrid character and word level modelsFastText1 人类语言发音:语音(Phonetics)和语音学(Phonology)语音(Phonetics)是发音流–是一种毫无争议的"物理信息"。语音学由一小部分或几组独特的类别单元组成:音素原创 2020-06-30 18:51:54 · 220 阅读 · 0 评论 -
CS224N笔记 Lecture2: Word Vectors and Word Sences
0 大纲回顾词向量和word2vec优化基础基于统计的词向量Glove模型和词向量1 回顾词向量和word2vec关于word2vec的更多细节1 为什么每个词要对应两个词向量?虽然一个词对应一个词向量也能够实现,但每个词对应两个词向量的平均优化时间更短。2 两个模型Skip-grams(SG)给出中心词(center word)预测上下文的词(outside)Continuous Bag of Words(CBOW)从大量的上下文词汇中预测中心词。(朴素贝叶斯)原创 2020-06-27 21:46:34 · 235 阅读 · 0 评论 -
CS224N笔记 Lecture1: Introduction and Word Vectors
0 目录教学目标人类语言和词义(word meaning)Word2vec介绍Word2vec目标函数梯度优化方法1 教学目标了解有效的现代深度学习方法首先学习基础知识,然后学习一些NLP领域中重要的方法:RNN,以及attention机制等等对人类语言的全局把握以及理解和形成人类语言的一些困难理解并掌握怎样去构造一个系统(PyTorch)来解决NLP领域中的一些主要的问题:Word MeaningDependency ParsingMachine Transla原创 2020-06-24 16:42:34 · 239 阅读 · 0 评论