1.Pandas包中DataFrame 的应用
下面都是工作种经常用到的方法,随手记录下来
1.1 数据库数据存储
from sqlalchemy import create_engine
engine= create_engine("mysql+pymysql://data_user:youruser@192.168.0.255:3306 /data2?charset=utf8")
这里一定要写成mysql+pymysql,不要写成mysql+mysqldb
DataFrame.to_sql(name=新建表名,con=engine,flavor='mysql',if_exists=’fail’)
如果该表已存在,想接着后面持续插入数据,if_exists就可以改为 append,
1.2 修改df的列名
暴力方法:df.columns=[‘a’,’b’,’c’]
缺点:必须依次写下所以列的名字
推荐方法:df.rename(columans={‘A’:’a’,’B’:’b’},inplace=True)
inplace为Ture则表示在原表上完成,为False则不改变原表的结构
1.3 按某列的值查找某一行或多行
df.loc[df[‘columns’]==’value’
1.4 df的排名和排序
按特定列排序:result_df=result_df.sort(columns=’指定列名’,axis=0,ascending=False)
ascending为False 为降序,为True则为升序
也可以用 df.sort_value=(by=’列名’)的方法(这种方式比较规范,是官方比较提倡的)
df.sort_value(['state'

最低0.47元/天 解锁文章
1312

被折叠的 条评论
为什么被折叠?



