目录 前言 1. NLP 1.1 Transformer架构 2. CV 2.1 CNN架构 2.2 Transformer架构 前言 本篇博客将记录深度学习领域常见模型的大小,具体算法如下 torchinfo.summary(model) 模型可能来自于PyTorch官方,HuggingFace等。 如有错误或者建议欢迎在评论区指出。 第三方库 版本 transformers 4.30.2 PyTorch 2.0.1 1. NLP 1.1 Transformer架构 Encoder-Only架构 模型 来源 总参数量 总参数量 BERT-base HuggingFace 109,482,240 109.