import pandas as pd
csv_data = pd.read_csv('file1.csv') # 读取数据
#取一半行的数据,并存储到新的文件
df = pd.DataFrame()
df=csv_data[0:(int)(csv_data.shape[0]/2)]
df.to_csv(path_or_buf='file2.csv',index=False)
#取某些列,按照新的顺序排列,并存储到新的文件
df = pd.DataFrame()
df=(csv_data.loc[:,['workclass', 'education', 'capital_loss', 'hours_per_week']])
df.to_csv(path_or_buf='file2.csv',index=False)