《昇思25天学习打卡营第4天|Transforms数据变换》

打卡

在这里插入图片描述

首先我们深度学习处理的数据不是可以直接输入进行处理,都是要经过数据处理,或者清洗的。
现在就看看,mindspore提供的简单的transforms形式

  • 还是用系统提供的数据,下载处理
    首先导入相关的包
import numpy as np
from download import download
from PIL import Image
from mindspore.dataset import transforms, vision, text
from mindspore.dataset import GeneratorDataset, MnistDataset

在这里插入图片描述

Common Transforms

在这里插入图片描述

Vision Transforms

# vison transforms
# Rescale 有两个参数 rescale 缩放因子 shift :平移因子
random_np = np.random.randint(0, 255, (48, 48), np.uint8)
random_image = Image.fromarray(random_np)
print(random_np)
)
rescale = vision.Rescale(1.0 / 255.0, 0)
rescaled_image = rescale(random_image)
print(rescaled_image)

# Normalize 三个参数 mean 图像每个通道均值,std:图像每个通道标准差 is_hwc bool值 True为(hwc) False(chw)
normalize = vision.Normalize(mean=(0.1307,), std=(0.3081,))
normalized_image = normalize(rescaled_image)
print(normalized_image

# hwc2chw 
hwc_image = np.expand_dims(normalized_image, -1)
hwc2chw = vision.HWC2CHW()
chw_image = hwc2chw(hwc_image)
print(hwc_image.shape, chw_image.shape)

# Text Transforms
texts = ["Welcome to Beijing"]
test_dataset = GeneratorDataset(texts, "text")
# PythonTokenizer j进行分词
def my_tokenizer(content):
    return content.split()


test_dataset = test_dataset.map(text.PythonTokenizer(my_tokenizer))
print(next(test_dataset.create_tuple_iterator()))

# lookup 词表映射变化 token->index 
vocab = text.Vocab.from_dataset(test_dataset)
print(vocab.vocab())

# Token->Index
test_dataset = test_dataset.map(text.Lookup(vocab))
print(next(test_dataset.create_tuple_iterator()))

# Lambda Transforms 可以使用lambda表达式
test_dataset = GeneratorDataset([1,2,3], 'data', shuffle=False)
test_dataset = test_dataset.map(lambda x:x * 2)
print(list(test_dataset.create_tuple_iterator()))

# 复杂的
def func(x):
    return x * x + 2
test_dataset= test_dataset.map(lambda x:func(x))
print(list(test_dataset.create_tuple_iterator()))
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值