文章目录
摘要
在之前学习了一些机器学习相关理论之后,本周进行了一些简单的代码实操学习,学习了PyTorch环境的配置及安装,学习了DataSet类对图像数据的处理,简单学习了TensorBoard的安装与使用,实操了一些常见的Transforms对图像的变换操作
Abstract
After learning some theories related to machine learning, I have done some simple code operation learning this week, including the configuration and installation of PyTorch environment, the processing of image data by DataSet class, and the installation and use of TensorBoard. Some common Transforms to images are implemented
1.PyTorch环境的配置及安装
安装Anaconda,网址:https://www.anaconda.com/
安装成功之后,打开Anaconda的命令窗口,左侧有base代表安装成功
在做不同的项目时,可能遇到不同版本的环境,比如这个项目用到pytorch 0.4,另一个项目用到pytorch 1.0,若你卸载了0.4,安装1.0版本,再碰到0.4版本,就要又卸载1.0版本,安装0.4版本。
Anaconda集成的conda包,创造出两个“房子”,一个是0.4版本,一个是1.0版本,需要哪个版本就使用哪个。
使用conda指令,创建一个“屋子”,-n后面是屋子的名字(可以自己起),python=3.8是python3.8版本。
conda create -n pytorch python=3.8
conda activate pytorch 激活这个环境
pip list 查看这个环境中的工具包
接下来安装pytorch,网址:https://pytorch.org/
conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia
检验安装是否成功
使用torch.cuda.is_available()来验证计算机的GPU是否可以被pytorch使用
使用PyCharm配置环境
- 创建一个pytorch项目
在Python Console中进行一下输入
跟在命令行里一样,判断GPU是否可以被pytorch使用
安装配置jupyter
打开Anaconda命令行,执行
conda activate pytorch
conda install nb_conda (安装一个包
jupyter notebook (启动jupyter
2.两个Python常用函数
dir():打开,看见(让我们知道工具箱以及工具箱中的分隔区有什么东西)
help():说明书
例如:dir(torch)可以查看torch下面的一些工具
对于help()函数,可以让我们知道每个工具是如何使用的,工具的使用方法。(查看的是官方使用文档
3.DataSet
- DataSet
DataSet:提供一种方式去获取数据及其label
- 如何获取每一个数据及其label
- 告诉我们总共有多少个数据
同时对于数据集的组织形式,有两种方式:
- 文件夹的名字,就是数据的label
- 文件名和label,分别处在两个文件夹中,label可以用txt的格式进行存储
比如:以下图片的label就是ants
from torch.utils.data import Dataset
from PIL import Image
import os
'''
定义一个class类,继承 Dataset (from torch.utils.data import Dataset)
在类中,定义三个函数:
分别是:初始化 init、获得每一个数据 getitem、数据长度 len。
其中:
1.init:图片所在根路径,标签名,合并路径,将文件夹中的所有图片名字做成