选取操作
选取一行
按某一列的值排序
df_date = df.sort_values(by=‘looked_up_at’, ascending=False)
- by, 列名
- ascending = True, 从小到大排序; False, 从大到小排序
对某一列去重
df_date_drop = df_date.drop_duplicates(subset=[‘username’], keep=‘first’)
- subset: 去重列名
- keep: 保留的行, 默认是first
- first: 保留第一项
- last: 保留最后一项
- False: 删除所有重复项
删除某一列
df_date_drop = df_date_drop.drop([‘stock_code’], axis=1)
重命名列名
df_look_up.columns = ['查看最多的股票', '查看次数', '最多股票最后一次查询时间']
df = df.rename(columns={'aaa': 'bbb'})
显示每一列的名称
df.columns.values
筛选出某几列
count = count[[‘page_views’, ‘stock_name’]]
重置索引
result = result.reset_index()
设置索引
result = result.set_index(‘券商名称’)
检测DataFrame是否为空
if df.empty:
print("df is empty")