数据操作 / 数据预处理

这篇博客介绍了PyTorch中张量的创建和访问,特别是切片符号的使用。讨论了张量的形状和reshape函数,以及如何用torch.zeros()和torch.ones()初始化张量。此外,还涵盖了张量间的算术运算和torch.cat()的拼接功能。广播机制使得不同形状的张量能进行运算。在数据预处理部分,提到了处理缺失数据的方法,包括数值型和非数值型数据的插值或删除,以及如何将数据转化为张量。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.数组创建和访问

创建的话需要定义尺寸、数据类型和数值

访问比较新的地方是切片符号 :

 

 

2.数据操作

张量tensor

张量tensor表示一个由数值组成的数组,它可能有多个维度

 

形状 

张量的shape属性可访问张量的形状和元素总数,numel可访问元素总数

reshape()函数 可在不改变元素值的情况下改变张量的形状 

 

torch.zeros() / torch.ones() 

可以赋值全0或全1,还可以用列表赋值 

 

 

张量之间的运算

+ - * / **等都可,按照数组一一对应算

 

张量拼接 torch.cat

->如果是三维,dim还可以=2,这里我还不是很理解怎么拼,有时间和numpy一起复习一下

广播机制

由于该机制,可对形状不同的张量进行操作,前提是维度一样

其实很简单,x为(1,4),y为(2,1),那在x轴x复制成(2,4),在y轴 y复制成(2,4),然后加到一起(小的复制以便和大的一致)

数据预处理

这里一般用csv文件,需要掌握pandas包的使用

 处理缺失数据(插值 / 删除)

对于数值型,我们可以用平均值进行插值

 对于类别值或离散值(这里我不是很清楚这些说法,大概就是说字符之类的非数值型),可以将NaN视作一个类别

 经过转换,inputs和outputs全都变成数值型,可以转化成张量了

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值