数据预处理(时序数据)
Dataframe某一列去除重复项
df = df['name'].drop_duplicates()
创建一个空的Dateframe
df = pd.DataFrame(columns=[])
Dataframe根据列值选择特定行
new_df= df.loc[df['name']=='some_value']
Dateframe根据索引排序
df = df.sort_index()
Dataframe输出显示的行or列
pd.set_option('display.max_rows', 8/None)
pd.set_option('display.max_columns', 8/None)
判断Dataframe是否为空
if df is None:
取Dataframe某列和某几列
df = df['column_name']
df = df[['column_1','column_2']]
Dataframe添加某列向上/向下1移位列并插入第1列后
df.new_column = df.column.shift(-1/1)
df.insert(1,'new_column',df.new_column)
复制dataframe
new_df= df.copy()
dataframe相加
df = df_1.add(df_2, fill_value=0)
两个dataframe按索引外连接(索引不存在时使用缺失值)

这篇博客主要介绍了在处理时序数据时,Dataframe的一些常用操作,包括去除重复项、选择特定行、排序、添加列、计算累积值、进行外连接、设置索引、数据拼接、数值保留小数、滑动窗口计算等。同时,还涉及了与numpy的交互,如读写txt文件和排序。
最低0.47元/天 解锁文章
817

被折叠的 条评论
为什么被折叠?



