
pandas
liukai6
这个作者很懒,什么都没留下…
展开
-
pandas的fillna函数替换空置失败
在使用pandas替换数据中的空值的时候出现了无法生效的情况df.fillna(value=0,inplace = True)注意加上inplace参数就可以了原创 2020-04-23 16:30:31 · 2635 阅读 · 1 评论 -
使用pandas将多个excel文件合并为一个(作为sheet)
import pandas as pddates = ["20200218_v2.csv","20200219_v2.csv","20200220_v2.csv","20200221_v2.csv"]# 循环读取并,生成多列writer = pd.ExcelWriter("total-0221.xlsx")for date in dates: df = pd.read_csv(...原创 2020-02-25 11:32:27 · 2439 阅读 · 2 评论 -
python中更换列名
# 方法1a.columns = ['a','b','c']# 方法2a.rename(columns={'A':'a', 'B':'b', 'C':'c'}, inplace = True)原创 2020-01-18 20:27:33 · 6381 阅读 · 0 评论 -
pandas中数据的处理
# 选择col列的值大于0.5的行df[df[col] > 0.5]:# 按照列col1排序数据,默认升序排列df.sort_values(col1):# 按照列col1降序排列数据df.sort_values(col2, ascending=False):# 先按列col1升序排列,后按col2降序排列数据df.sort_values([col1,col2], ascendi...原创 2020-01-18 20:25:44 · 223 阅读 · 0 评论 -
pandas中数据合并的操作
# 将df2中的行添加到df1的尾部df1.append(df2):# 将df2中的列添加到df1的尾部df.concat([df1, df2],axis=1):# 对df1的列和df2的列执行SQL形式的joindf1.join(df2,on=col1,how='inner'):...原创 2020-01-18 20:21:12 · 361 阅读 · 0 评论 -
pandas中数据统计的函数
# 查看数据值列的汇总统计df.describe():# 返回所有列的均值df.mean():# 返回列与列之间的相关系数df.corr():# 返回每一列中的非空值的个数df.count():# 返回每一列的最大值df.max():# 返回每一列的最小值df.min():# 返回每一列的中位数df.median():返回每一列的标准差df.std():...原创 2020-01-18 20:19:13 · 495 阅读 · 0 评论 -
pandas中数据的选取
# 根据列名,并以Series的形式返回列df[col]:# 以DataFrame形式返回多列df[[col1, col2]]:# 按位置选取数据s.iloc[0]:# 按索引选取数据s.loc['index_one']:# 返回第一行df.iloc[0,:]:# 返回第一列的第一个元素df.iloc[0,0]:...原创 2020-01-18 20:16:43 · 283 阅读 · 0 评论 -
panda创建测试对象和查看数据概况
随机创建数使用numpypd.DataFrame(np.random.rand(20,5)):创建20行5列的随机数组成的DataFrame对象pd.Series(my_list):从可迭代对象my_list创建一个Series对象df.index = pd.date_range('1900/1/30', periods=df.shape[0]):增加一个日期索引查看pandas对象的概...原创 2020-01-18 20:14:30 · 265 阅读 · 0 评论 -
pandas的数据的导入导出
在进行pandas处理数据的时候,我们需要将数据导入到内存,进行处理后,再存储成相关内容的格式数据的导入pd.read_csv(filename):从CSV文件导入数据pd.read_table(filename):从限定分隔符的文本文件导入数据pd.read_excel(filename):从Excel文件导入数据pd.read_sql(query, connection_object...原创 2020-01-18 20:11:11 · 794 阅读 · 0 评论 -
pandas在进行导出操作的覆盖解决办法
pandas进行写入excel的时候会出现后面覆盖前面数据的情况writer = pd.ExcelWriter('大众.xlsx')df1.to_excel(writer,"配置")df2.to_excel(writer,"外观")df3.to_excel(writer,"内饰")writer.save()...原创 2020-01-17 17:11:03 · 1191 阅读 · 0 评论 -
pandas更换列的顺序
对列的顺序进行处理order = ['date', 'time', 'open', 'high']df = df[order]会按照新的列规则来进行排列原创 2020-01-15 15:33:08 · 2662 阅读 · 0 评论 -
在python中使用numpy进行集合上的求差
对集合上求差值的方法import numpy as npimport time,random# 用来求数组中差距效率start = int(time.time())# 生成120000大小的列表arr1 = np.random.randint(0,100,120000)arr2 = [1001,30,60,10034]# 注意前面减去后面的列表arr3 = np.setdiff1...原创 2020-01-14 00:09:53 · 3110 阅读 · 0 评论 -
pandas中的DataFrame的求差值,并集,交集
df1 = DataFrame([['a', 10, '男'], ['b', 11, '男'], ['c', 11, '女'], ['a', 10, '女'], ['c', 11, '男']], columns=['name...原创 2019-10-28 20:57:21 · 5506 阅读 · 1 评论 -
pandas求DataFrame格式的行数列数
pandas的DataFrame格式数据返回列数:df.shape[1]返回行数:df.shape[0]或者:len(df)原创 2019-10-28 20:52:20 · 901 阅读 · 1 评论 -
在python中将数据库查询数据进行转换为DataFrame格式
#python中将数据库查询的tuple数据转换为dataframe格式df = pd.DataFrame(list(result))print(df)# res 打印结果6675 5 39098346676 200 30643996677 5 39330216678 62 20347476679 2 21596276680 200 2643...原创 2019-10-28 20:21:55 · 3351 阅读 · 0 评论 -
pandas对每一行进行操作
pandas对一行或者多行进行获取要获取某一行,你需要用 .loc[] 来按索引(标签名)引用这一行,或者用 .iloc[],按这行在表中的位置(行数)来引用。同时你可以用 .loc[] 来指定具体的行列范围,并生成一个子数据表,就像在 NumPy里做的一样。比如,提取 ‘c’ 行中 'Name’ 列的内容条件筛选用中括号 [] 的方式,除了直接指定选中某些列外,还能接收一个条件语句,然后...原创 2019-04-14 15:52:10 · 13405 阅读 · 2 评论 -
pandas对DataFrame中列的操作
获取DataFrame中的列要获取一列的数据,还是用中括号 [] 的方式,跟 Series 类似。比如尝试获取上面这个表中的 name 列数据:data["name"]因为我们只获取一列,所以返回的就是一个 Series。可以用 type() 函数确认返回值的类型:type(data["name"])向DataFrame中增加列增加数据列有两种办法:可以从头开始定义一个 pd.Se...原创 2019-04-14 14:49:22 · 3794 阅读 · 0 评论