大纲
语言模型:
- NLP任务中最基本和重要的一部分
- 包括大量的语言理解知识,比如语法,句法
- 只需要纯文本的信息就可以训练,不需要人工标注
word2vec是第一个预训练语言模型,目前,基于 Transformers 的PLMs更普遍
GPT PLM
MLM(masked LM)
GPT-3
Pipeline接口,已经训练好的模型
Tokenization
语言模型:
word2vec是第一个预训练语言模型,目前,基于 Transformers 的PLMs更普遍
GPT-3
Pipeline接口,已经训练好的模型
Tokenization