一、torchvision
- torchvision.datasets:包含了在计算机视觉中常见的数据集
- torchvision.models:预训练好的模型
- torchvision.tramsforms:关于图片预处理和数据增强的方法
- torchvision.io:视频、图片和文件的 IO 操作的功能,它们包括读取、写入、编解码处理操作
- torchvision.ops :计算机视觉的特定操作
- torchvision.utils:可视化的方法,可以帮助我们将若干张图片拼接在一起、可视化检测和分割的效果
二、 PyTorchVideo
1、 特点
基于 PyTorch
Model Zoo
数据预处理和常见数据
模块化设计
支持多模态
移动端部署优化
2、 PyTorchVideo model zoo 三种使用方法
1) TorchHub,这些模型都已经在TorchHub存在。我们可以根据实际情况来选择需不需要使用预训练模型
2)PySlowFast,使用 PySlowFast workflow 去训练或测试PyTorchVideo models/datasets.
3)PyTorch Lightning建立一个工作流进行处理
三、torchtext
1、用于自然语言处理(NLP)的工具包
2、组成部分
1)数据处理工具 torchtext.data.functional、torchtext.data.utils
2)数据集 torchtext.data.datasets
3)词表工具 torchtext.vocab
4)评测指标 torchtext.metrics
3、数据集构建
1)Field是torchtext中定义数据类型以及转换为张量的指令
2)定义Field对象完成后,通过get_dataset函数可以读入数据的文本和标签,将二者连同field 一 起送到torchtext.data.Dataset类中,即可完成数据集的构建。
3)词汇表
使用Field自带的build_vocab函数完成词汇表构建
4) 评测指标(metric)
BLEU (bilingual evaluation understudy) score来评价预测文本和标签文本之间的相似程度
参考DataWhale课程:深入浅出PyTorch进阶
PyTorch深度解析:vision, video与NLP工具集
510

被折叠的 条评论
为什么被折叠?



