Pandas包中DataFrame 的应用

最新推荐文章于 2024-03-29 09:27:17 发布

原创

最新推荐文章于 2024-03-29 09:27:17 发布 · 463 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#DataFrame #python

1.Pandas包中DataFrame 的应用

下面都是工作种经常用到的方法，随手记录下来
1.1 数据库数据存储

        from sqlalchemy import create_engine
        engine= create_engine("mysql+pymysql://data_user:youruser@192.168.0.255:3306 /data2?charset=utf8")

这里一定要写成mysql+pymysql，不要写成mysql+mysqldb

    DataFrame.to_sql(name=新建表名,con=engine,flavor='mysql',if_exists=’fail’)

如果该表已存在，想接着后面持续插入数据，if_exists就可以改为 append,
1.2 修改df的列名
暴力方法：df.columns=[‘a’,’b’,’c’]
缺点：必须依次写下所以列的名字
推荐方法：df.rename(columans={‘A’:’a’,’B’:’b’},inplace=True)
inplace为Ture则表示在原表上完成,为False则不改变原表的结构
1.3 按某列的值查找某一行或多行

    df.loc[df[‘columns’]==’value’

1.4 df的排名和排序
按特定列排序：result_df=result_df.sort(columns=’指定列名’,axis=0,ascending=False)
ascending为False 为降序，为True则为升序
也可以用 df.sort_value=(by=’列名’)的方法（这种方式比较规范，是官方比较提倡的）