本问题已经有最佳答案,请猛点这里访问。
我有一个csv文件,如下所示:
index,Avg,Min,Max
Build1,56.19,39.123,60.1039
Build2,57.11,40.102,60.2
Build3,55.1134,35.129404123,60.20121
基于我在这里的问题,我可以通过这个简短的脚本向这个csv添加一些相关信息:
import pandas as pd
df = pd.read_csv('newdata.csv')
print(df)
df_out = pd.concat([df.set_index('index'),df.set_index('index').agg(['max','min','mean'])]).rename(index={'max':'Max','min':'Min','mean':'Average'}).reset_index()
with open('newdata.csv', 'w') as f:
df_out.to_csv(f,index=False)
这就产生了这个csv:
index,Avg,Min,Max
Build1,56.19,39.123,60.1039
Build2,57.11,40.102,60.2
Build3,55.1134,35.129404123,60.20121
Max,57.11,40.102,60.20121
Min,55.1134,35.129404123,60.1039
Average,56.1378,38.1181347077,60.16837
我现在想要它,这样我可以更新这个csv。例如,如果我运行一个新的构建(例如build4),我可以将其添加到中,然后重新执行max、min和average行。我的想法是,我因此删除标签为max、min、average的行,添加我的新行,重做统计。我相信我需要的代码非常简单(只适用于max,但也有代表min和average的行):
df = pd.read_csv('newdata.csv')
df = df.drop('Max')
但是,这始终会导致值错误:标签['max']不包含在轴中
我已经创建了崇高文本的csv文件,这是问题的一部分吗?我读过其他关于这个的文章,没有一篇能帮助我解决这个问题。
我不确定是否允许这样做,但这里有一个到我的csv的下载链接,以防文件本身出现问题。
我有两个可能的答案:
如何解决此放置问题
如何添加更多的构建和更新统计信息(一个不带drop的方法)
df.drop('Max', axis=1)—默认轴为0?
我想知道为什么这个被标记为副本。关联问题明显不同。
必须指定轴参数。默认值为轴=0,即行、列、轴=1。
所以这应该是你的代码。
df = df.drop('Max',axis=1)
编辑:看看这段代码:
df = pd.read_csv('newdata.csv')
df = df.drop('Max')
您使用的代码没有指定csv文件的第一列包含数据帧的索引。因此,熊猫会在飞行中创建一个索引。这个索引纯粹是数字索引。所以您的索引不包含"max"。
尝试以下操作:
df = pd.read_csv("newdata.csv",index_col=0)
df = df.drop("Max",axis=0)
这将强制熊猫使用csv文件中的第一列作为索引。这意味着代码现在可以工作了。
抱歉,一定有点混乱,因为我有max作为一列和一行。我想把这一排放下。drop('max',axis=1)按预期工作,但当我执行df.drop('max',axis=0)时,我得到一个错误。
@更新了abdall答案。我相信它现在应该起作用了。
天哪,有这么多小的事情要跟踪。很抱歉弄混了,但谢谢你也帮助我理解你的解决方案。按预期工作。
要删除熊猫中的特定列,只需执行以下操作:
del df['Max']
我尝试了上面建议的方法,修正了索引,但仍然遇到了同样的问题。键错误:在轴中找不到"["xyz']。然而,这为我解决了这个问题。我到底有什么不同之处?