Pandas基础题一百道(前15)

本文介绍了Pandas库的基础操作,包括使用List、Dict创建Series,Series与DataFrame之间的转换,Numpy创建Series,转换数据类型,添加元素,设置索引等15个关键操作。详细讲解了每个操作的实现方法和步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

1、使用List创建Series

2、使用Dict创建Series

3、将Series转换成List

4、将Series转换成DataFrame

5、借助Numpy创建Series

6、转换Series数据类型(要求转换为int)

7、给Series添加新的元素(要求添加物理与化学成绩)

 8、Series转换为DataFrame(reset_index)

 9、使用字典创建一个DataFrame 

10、设置DataFrame索引列

 11、生成一个月份的所有天(要求输出2022/3)

12、生成一年的所有周一 

 13、生成一天当中的所有小时

 14、用日期DataFrame

 15、使用日期和随机数生成DataFrame


1、使用List创建Series

 Series 类似表格中的一个列(column),类似于一维数组,可以保存任何数据类型。

Series构造方法:

pandas.Series( data, index, dtype, name, copy)

  • data:一组数据(ndarray 类型)。

  • index:数据索引标签,如果不指定,默认从 0 开始。

  • dtype:数据类型,默认会自己判断。

  • name:设置名称。

  • copy:拷贝数据,默认为 False。

①:List数据

data=["11","12","45","56"]

②:使用List创建Series

 df=pd.Series(data=data)

2、使用Dict创建Series

 Series 类似表格中的一个列(column),类似于一维数组,可以保存任何数据类型。

Series构造方法:

pandas.Series( data, index, dtype, name, copy)

  • data:一组数据(ndarray 类型)。

  • index:数据索引标签,如果不指定,默认从 0 开始。

  • dtype:数据类型,默认会自己判断。

  • name:设置名称。

  • copy:拷贝数据,默认为 False。

①:Dict数据

data={
    "语文":80,
    "数学":90,
    "英语":85,
    "计算机":100
}

②:使用Dict创建Series

df=pd.Series(data=data) 

3、将Series转换成List

 Series 类似表格中的一个列(column),类似于一维数组,可以保存任何数据类型。

Series构造方法:

pandas.Series( data, index, dtype, name, copy)

  • data:一组数据(ndarray 类型)。

  • index:数据索引标签,如果不指定,默认从 0 开始。

  • dtype:数据类型,默认会自己判断。

  • name:设置名称。

  • copy:拷贝数据,默认为 False。

①:Series数据

data=pd.Series({
    "语文":80,
    "数学":90,
    "英语":85,
    "计算机":100
})

 

② :将Series转换成List

df=data.tolist()

4、将Series转换成DataFrame

Series:

 Series 类似表格中的一个列(column),类似于一维数组,可以保存任何数据类型。

Series构造方法:

pandas.Series( data, index, dtype, name, copy)

  • data:一组数据(ndarray 类型)。

  • index:数据索引标签,如果不指定,默认从 0 开始。

  • dtype:数据类型,默认会自己判断。

  • name:设置名称。

  • copy:拷贝数据,默认为 False。

DataFrame:

DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。

DataFrame 既有行索引也有列索引

### 关于 Pandas基础面试目 #### 什么是 PandasPandas 是一种强大的 Python 库,专门用于数据分析和处理。其主要特点在于提供了一种灵活高效的数据结构 DataFrame 和 Series 来存储和操作表格型数据[^2]。 #### 解释一下 Pandas 中的 `DataFrame` 和 `Series`。 - **DataFrame**:类似于电子表格或 SQL 表格的形式,由行和列组成,可以容纳不同类型的数据(整数、字符串、浮点数等)。每一列表示一个字段,每行列出记录。 - **Series**:一维标记数组,能够保存任何类型的数据;它是单列的 DataFrame 或者说是带有标签的一维 ndarray。 #### 如何读取 CSV 文件到 Pandas 的 DataFrame 中? 可以通过调用 `pandas.read_csv()` 函数轻松加载外部文件中的数据至内存中作为 DataFrame 对象进行后续的操作: ```python import pandas as pd df = pd.read_csv('data.csv') ``` #### 描述如何使用 `groupby()` 方法以及它的作用是什么? `groupby()` 方法允许按照某些条件对数据集进行分割,从而可以在各个独立部分上执行聚合运算或其他函数应用。这有助于深入挖掘数据内部规律并简化复杂查询逻辑。例如统计各城市销售额总和: ```python sales_by_city = df.groupby(['City']).sum()['Sales'] print(sales_by_city) ``` #### 怎样找出某一列中最常出现的值即众数? 对于想要获取某特定属性下最常见的数值情况时,可利用 `.mode()` 方法快速求得该列的众数。比如寻找价格栏位里重复次数最多的金额: ```python most_frequent_price = df['price'].mode()[0] print(most_frequent_price) ``` #### 使用 Pandas 进行简单描述性统计的方法有哪些? 为了更好地了解整个数据集概况,可以直接运用内置函数如 `describe()` 获取基本统计数据概览,包括计数、平均值、标准差、最小/最大值及四分位间距等重要指标: ```python summary_statistics = df.describe() print(summary_statistics) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值