数据分析之概要——pandas01

一、pandas库的Series类型

1、定义

Series类型由一组数据及与之相关的数据索引组成:

自动生成索引: 

 指定索引:

 2、创建

1)从标量值创建

(由于只给定了一个标量,故需要指定索引以告诉大小)

 

2) 从字典类型创建

左边是键值对应的情况,key作为索引;右边修改了索引

 3)从ndarray类型创建

3、基本操作

1)Series类型的基本操作

b.index  # 获得索引
b.values  # 获得数据

自动索引和自定义索引都可以对数据进行引用,但是不能混用,混用时默认为自定义索引:

2)Series对齐操作

3)Series对象的name属性

4)Series类型的修改

二、pandas库的DataFrame类型

1、定义

与Series不同的是它像表格,有多列数据

2、创建

1)从二维ndarray对象创建

2)从一维ndarray对象字典创建

3)从列表类型的字典创建

三、pandas库的数据类型操作

1、重新索引

2、索引类型

索引类型的常用方法:

 四、pandas库的数据类型运算

1、算数运算法则

2、方法形式的运算

广播运算指:所有数减去同一个数,比如Series一维数据减去0维数据(即标量),为里面的所有元素都减去这个数据

3、比较运算法则

### 配置 Pandas 库进行数据处理和分析 为了有效配置并使用 `Pandas` 进行数据处理和分析,需先确保已安装该库。通常情况下,在 Python 环境中可以通过包管理工具 pip 安装最新版本的 Pandas: ```bash pip install pandas ``` 一旦完成安装,每次启动新的 Python 脚本或交互会话时都应导入此库,并习惯性地为其设置一个简短的别名以便后续调用[^1]。 #### 导入 Pandas 并设定别名 ```python import pandas as pd ``` 上述命令不仅加载了整个 Pandas 功能集到当前工作空间内,而且定义了一个快捷方式 (`pd`) 来简化函数调用语法。这一步骤对于提高编码效率至关重要。 #### 初始化 DataFrame 或 Series 对象 在实际应用过程中,往往需要创建 `DataFrame` 或者 `Series` 类型的对象来存储待处理的数据集合。这些对象可以由多种不同形式的数据源初始化而成——比如列表、字典或是外部文件(CSV, Excel 文件等)。下面是一个简单的例子展示如何基于字典建立一个新的 `DataFrame` 实例: ```python data = {'Column_1': [10, 20, 30], 'Column_2': ['A', 'B', 'C']} df = pd.DataFrame(data) print(df) ``` 这段代码片段展示了怎样快速构建一个包含两列的基础表格结构用于进一步的操作与探索。 #### 数据预览与基本信息查看 当面对新获取的数据集时,初步了解其整体面貌是非常重要的。为此,`head()` 方法允许用户仅显示前几条记录;而 `info()` 则提供了有关各字段属性以及缺失值情况的关键统计信息。 ```python # 显示前三行数据 print(df.head(3)) # 获取关于 dataframe 的概要信息 print(df.info()) ``` 以上操作有助于迅速掌握所处理数据的大致轮廓及其潜在质量问题,从而指导下一步的具体行动方向。 #### 基础数据清理与转换 针对脏乱差的数据状况,常见的修正措施包括但不限于重命名列标签、填补空白项、移除重复实体等。这里给出几个实用技巧作为示范: - **更改列名称** ```python df.columns = ["New_Name_Col1", "New_Name_Col2"] ``` - **填充 NaN 值** ```python df.fillna(value=0, inplace=True) # 使用零替换所有空缺位置 ``` - **去除冗余行** ```python df.drop_duplicates(inplace=True) ``` 通过执行上述指令序列,可以使原始资料变得更加整洁有序,进而有利于后续更深入层次上的挖掘研究活动开展。 #### 总结 综上所述,通过对 Pandas 库的有效配置及运用,可以在很大程度上提升数据科学家们的工作效能。从基础环境搭建直至高级特性发挥,每一个环节都是不可或缺的整体组成部分[^2]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值