
pandas
徕胖
凡事到最后必将皆大欢喜!
展开
-
python,pandas之随机抽样
'''生成抽样数据'''import pandas as pdimport numpy as npdf=pd.DataFrame(np.arange(600).reshape(100,6), #100行6列 columns=['A','B','C','D','E','F'])print(df)#设置随机种子np.random.seed(10)...原创 2020-02-24 17:51:02 · 5682 阅读 · 0 评论 -
DataFrame数据框合并(concat()和merge()函数)
1.concat()函数import pandas as pdimport numpy as np'''数据框合并 concat()函数使用方式:concat([df1,df2,df3……]),注意括号内的先后顺序对结果有影响。可以拼接多个数据框'''df1=pd.DataFrame(np.arange(12).reshape(3,4))df2=2*df1#竖向合并(行数增加)...原创 2020-02-24 15:55:31 · 15634 阅读 · 0 评论 -
pandas数据筛选(根据条件选择文件数据)
读取文件import pandas as pddf=pd.read_csv(r"C:\data\数据筛选\data1.csv",engine='python')1.比较运算选择数据'''比较运算,包含大于、小于等运算''''''选择好评数大于17000的数据'''#逻辑判断+取数print(df['好评数']>17000)#输出的是逻辑值,大于17000为真pr...原创 2020-02-24 12:32:41 · 10243 阅读 · 3 评论 -
pandas之silce函数的使用(字段截取函数)以及将截取后的字段加入DataFrame
silce()函数:字段截取函数,作用对象是字符串!!!原创 2020-02-24 11:14:01 · 20517 阅读 · 0 评论 -
查看DataFrame中每一列的数据类型
import pandas as pddf=pd.read_csv(r"C:\data\slice函数的使用\data1.csv",engine='python') #不写encoding='gbk'也行。默认是utf8print(df.dtypes)print('-----')print(df['id'].dtypes)#如果一列中含有多个类型,则该列的类型会是object,同样字...原创 2020-02-24 10:39:32 · 79211 阅读 · 0 评论 -
python,pandas读取文件后重复数据处理
data1.csv的内容如下:import pandas as pddf=pd.read_csv(r"C:\data\重复值处理\data1.csv",encoding='gbk',engine='python')#不写engine='python'可能会出现OSError: Initializing from file failed。1.找出重复值的位置'''找出重复值的位...原创 2020-02-23 16:50:17 · 4319 阅读 · 0 评论 -
python,pandas缺失值数据处理
缺失值数据处理方式:1.数据补齐 2.删除对应数据行 3.不处理data.csv文件内容:import pandas as pd'''uft-8编码:包含全世界所有国家需要用到的字符,英文网站用的较多gbk编码:包含全部的中文字符unicode编码:把所有语言统一到一套编码'''df=pd.read_csv(r"C:\data\data.csv",encoding='gb...原创 2020-02-23 16:13:57 · 4361 阅读 · 0 评论 -
pandas之数据文件导入和导出(python读取.csv,.txt,excel文件(.xlsx)以及导出为.csv、excel文件)
文件类型:.csv,.txt,.xlsx.csv文件,一行即为数据表的一行。生成数据表字段用逗号隔开(英文的逗号!!!!)。csv文件用记事本和excel都能打开,用记事本打开显示逗号,用excel打开,没有逗号了,逗号都用来分列了。.txt文件和.csv文件没有太大差别,.txt文件也可由用逗号进行分割,直接将.txt文件改成.csv文件完全可以。用excel打开data1.csv文...原创 2020-02-23 12:11:44 · 29542 阅读 · 2 评论 -
pandas之DataFrame查询(loc(),iloc(),ix())
1、loc,使用标签索引的方式(index和columns都是标签)。示例代码:import pandas as pdimport numpy as npdf=pd.DataFrame(np.random.randint(0,10,[3,4]),index=np.arange(0,3),columns=['A','B','C','D'])print(df)访问某个值#df....原创 2020-02-22 16:04:26 · 1118 阅读 · 0 评论 -
pandas之DataFrame使用详解
pandas数据类型DataFrameDataFrame(数据框),可以看成excel表。DataFrame是一种表格型数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型等),DataFrame既有行索引(index)也有列索引(column)。行索引和列索引是标签。可以被看做是由Series组成的字典。DataFrame的创建有多种方式,不过最重要的还是根据dic...原创 2020-02-22 00:30:05 · 23973 阅读 · 4 评论