日常小知识点积累:DataFrame.reset_index、pandas数据修改、matplotlib子图大小占比

本文详细介绍了使用Pandas进行数据处理的两个关键技巧:如何利用reset_index方法重新排序DataFrame的index,以及如何通过不同的切片方法修改DataFrame中的数据。通过实际示例展示了不同方法的应用效果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.pandas数据的index:

       当我们对pandas。DataFrame进行切片、融合操作后,DataFrame原有的index不会自动重新排序,这时候我们可以用pandas.DataFrame.reset_index方法让它重新排序:

DataFrame.reset_index(level=Nonedrop=Falseinplace=Falsecol_level=0col_fill='')

说说里面几个主要参数的含义:

 

  • drop : boolean, default False

pandas在调用这个方法时,默认会将旧index作为一列插入该DataFrame中,drop的含义就是不要生成旧index列,直接弃掉它们

  • inplace : boolean, default False

False:在原有数据上更改,不要创建新的DataFrame然后在新的数据上更改

 

2.pandas数据修改、赋值:

       当我们要对pandas.DataFrame的数据进行部分修改时,就要进行先取值后修改的过程。我在下面展示一下两种不同取值方法对赋值结果的影响:

dft = pd.DataFrame(dict(A = np.random.rand(3), B = 1, C = 'foo',D = pd.Timestamp('20010102'), E = pd.Series([1.0]*3).astype('float32'),F = False, G = pd.Series([1]*3,dtype='int8')))

dft['E'][[1,2]]

>>> 1    1.0
    2    1.0
    Name: E, dtype: float32


dft.loc[[1,2],'E']

>>> 1    1.0
    2    1.0
    Name: E, dtype: float32
# 由此可见,两种切片方式得到的结果是相同的,那么赋值结果是不是也一样?

 

# region 系统配置与依赖导入(保持原代码) import os import numpy as np import pandas as pd import torch import torch.nn as nn from torch.nn import TransformerEncoder, TransformerEncoderLayer import backtrader as bt from collections import deque import talib as ta import tushare as ts import matplotlib.pyplot as plt import random random.seed(42) np.random.seed(42) torch.manual_seed(42) TUSHARE_TOKEN = os.getenv('TUSHARE_TOKEN', '7c4345ae126e8426ac1ba9104027b91e3123f49e28ea8a81e7762b94') STOCK_LIST = ['600519.SH', '000858.SZ', '600887.SH'] START_DATE = pd.to_datetime('2018-01-01') END_DATE = pd.to_datetime('2023-12-31') INIT_CASH = 1000000 WINDOW_SIZE = 60 TECHNICAL_FEATURES = ['open', 'high', 'low', 'close', 'volume', 'macd', 'rsi', 'cci'] device = torch.device('cuda' if torch.cuda.is_available() else 'cpu') MODEL_DIR = './models' # endregion # 核心修复:MyPandasData类(基于Backtrader官方协议) class MyPandasData(bt.feeds.PandasData): """严格遵循Backtrader数据加载协议的实现""" params = ( ('datetime', 'trade_date'), ('open', 'open'), ('high', 'high'), ('low', 'low'), ('close', 'close'), ('volume', 'volume'), ('openinterest', -1), # 无此列设为-1 ) # 声明所有自定义指标列(别名=列名,需与DataFrame列名完全一致) lines = ( 'macd', # MACD主线 'rsi', # RSI指标 'cci', # CCI指标 'ma5', # 5日均线 'ma20', # 20日均线 ) def __init__(self): super().__init__() # 调试:打印自动生成的属性(验证别名绑定) print(f"[DataFeed] 可用指标属性: {', '.join(self.lines._linealiases)}") def _load(self): # 1. 数据清洗(保留原逻辑) df = self.p.dataname.copy() df[self.params.datetime] = pd.to_datetime(df[self.params.datetime]) df = df.sort_values(self.params.datetime).reset_index(drop=True) df = df[ (df[self.params.datetime] >= self.p.fromdate) & (df[self.params.datetime] <= self.p.todate) ].reset_index(drop=True) # 2. 基础列校验(Backtrader原生加载) if not super()._load():
03-30
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

_illusion_

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值