Pandas & Numpy:盲点

本文揭示了在使用Pandas和Numpy时容易遇到的一些盲点,包括构造DataFrame时指定index的影响,permutation与shuffle的区别,np.pad的用法,以及如何正确地进行切片操作、维度转换和数据索引等。特别强调了在处理数据帧时,保持index的一致性和正确使用loc和iloc的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. Pandas中,如果用字典构造系列和数据帧,如果强行指定index或者column,则以强行指定的为准,指定的index或者column中没有,但是字典本身有的数据将被忽略,指定的index或者column中有,但是字典本身没有的数据将被置NaN

2. DataFrame的某一列为Series,则DataFrame的index必须和Series的index一样,不然所有数据都将是NaN,因此使用这种方式的时候,最好的方法就是数据帧构建过程中不设置index,而是在每一个Series构建的时候构造相同的index,如下

# !user/bin/python
# -*- coding: UTF-8 -*-

import numpy as np
import pandas as pd

# 数据帧的选择

dic = {'col1' : pd.Series(np.arange(4),index = ['one', 'two', 'three', 'four']),
       'col2' : pd.Series(np.arange(100, 100 + 4), index = ['one', 'two', 'three', 'four'])}
df = pd.DataFrame(dic)
print(df)

#        col1  col2
# one       0   100
# two       1   101
# three     2   102
# four      3   103

3. permutation和shuffle

permutation传入一个int或者一个ndarray,shuffle只能传入一个ndarray

permutation有返回值,不改变原有arr,shuffle没有返回值,会改变原有arr

permutation速度比shuffle慢

import numpy as np

a
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值