- 博客(5)
- 收藏
- 关注
原创 pandas之基本的数据处理
表示对 DataFrame 的行进行重新索引,将原来的索引 [‘a’, ‘b’, ‘c’] 转变为 [‘a’, ‘b’, ‘d’];表示对 DataFrame 的列进行重新索引,将原来的列名 [‘A’, ‘B’] 转变为 [‘A’, ‘C’];否则返回 False。可以对Pandas对象中的所有数值进行逐一判断,然后返回一个同样大小的Pandas对象,如果是NaN标识的缺失值,则结果True,否则为False。方法返回的是一个新的 DataFrame 对象,原始的 DataFrame 对象并没有被修改。
2023-06-11 19:35:24
598
原创 pandas之DataFrame的创建和增删改查
DataFrameDataFrame的任意一行或者一列就是一个Series对象:一组数据(ndarray、series, map, lists, dict 等类型)。:索引值,或者可以称为行标签。:列标签,默认为 RangeIndex (0, 1, 2, …, n)。:数据类型。表示所有数据为object类型(对象型数据表示数据为字符串或包含混合数据类型)。:拷贝数据,默认为 False。
2023-06-10 16:10:02
937
原创 pandas之Series的创建和基本操作
数据索引标签,如果不指定,默认从 0 开始。无论我们是否为Series对象指定行索引,一个包含整数0到N-1(这里N是数据的长度)的默认索引将被创建,这种索引被称为位置索引。它可以接受多种参数来指定 Series 对象的数据,索引,数据类型和副本选项。Series可以像ndarray一样进行加减乘除幂等数学运算,数学运算会对所有的数值自动执行,不需要写循环来对其中的每一个值进行相同操作。有时我们在做数据处理时,原始数据的数字是字符串的类型,但是我们又要让它做数学运算。:拷贝数据,默认为 False。
2023-06-10 15:02:48
2198
原创 pandas之引入csv文件
指定每列数据的数据类型。例如 {‘a’: np.float64, ‘b’: np.int32}用作行索引的列编号或列名。可以是单个名称/数字或由多个名称/数字组成的列表(层次化索引)默认为0(第一行),如果没有header行就应该设置为None。指定读取其中的几列,usecols=[‘grade’]表明只读grade列。用于结果的列名列表,结合header=None。指定字符集编码类型,通常指定为’utf-8’一组用于替换NA/NaN的值。文件块的大小,降低内存占用。方法,可以读取任意大小的块。
2023-06-10 14:11:06
791
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人