
pandas
司南锤
记录个人学习历程,与大家一起交流成长~
展开
-
Pandas 17-行操作和列操作
通过行操作和列操作,可以灵活地对 DataFrame 进行数据处理。# 创建示例 DataFrame# 使用标签索引选择行print("使用标签索引选择行:")# 使用位置索引选择行print("\n使用位置索引选择行:")# 使用 loc 添加行print("\n使用 loc 添加行:")print(df)# 使用 append 方法添加行print("\n使用 append 方法添加行:")print(df)# 删除行print("\n删除行:")原创 2024-09-03 12:04:47 · 754 阅读 · 0 评论 -
Pandas 16-条件格式化
通过条件表达式、apply 方法和样式功能,可以灵活地对 DataFrame 进行条件格式化,以便更直观地展示数据特征。# 创建示例 DataFrame# 使用条件表达式进行格式化df['A_formatted'] = df['A'].apply(lambda x: '高' if x > 3 else '低')print("使用条件表达式进行格式化:")print(df)# 自定义格式化函数if value > 30: return '高'原创 2024-09-03 11:58:12 · 360 阅读 · 0 评论 -
Pandas 15-透视表,分组,聚合(group by)
通过透视表、分组和聚合操作,可以灵活地对数据进行多维度的分析和汇总。# 创建示例 DataFrame'日期': ['2023-01-01', '2023-01-01', '2023-01-02', '2023-01-02'],'城市': ['北京', '上海', '北京', '上海'],'温度': [3, 5, 4, 6]})# 创建透视表。原创 2024-09-03 11:51:38 · 548 阅读 · 0 评论 -
Pandas 14-读取各种类型文件
Pandas 提供了丰富的功能来读取各种类型的文件,使得数据导入过程变得简单和高效。根据不同的数据源和需求,可以选择合适的读取方法。# 读取 CSV 文件print("CSV 文件内容:")# 读取 Excel 文件print("\nExcel 文件内容:")# 读取 JSON 文件print("\nJSON 文件内容:")# 读取 SQL 数据库print("\nSQL 数据库内容:")# 读取 HTML 文件print("\nHTML 文件内容:")原创 2024-09-03 11:48:23 · 593 阅读 · 0 评论 -
Pandas 13-定位、旋转数据表(行列转换)
方法用于将列索引转换为行索引,即将宽格式数据转换为长格式数据。方法用于将行索引转换为列索引,即将长格式数据转换为宽格式数据。方法用于将数据从长格式转换为宽格式,即行转列。,但更灵活,可以进行聚合操作。原创 2024-09-03 11:45:29 · 528 阅读 · 0 评论 -
Pandas 12-处理重复数据
方法用于检测 DataFrame 中的重复行。默认情况下,会返回一个布尔 Series,指示每一行是否是重复的。方法用于删除 DataFrame 中的重复行。默认情况下,会删除所有重复行,只保留第一次出现的行。参数用于指定如何标记重复项。参数用于指定基于哪些列来检测重复项。原创 2024-09-03 11:41:17 · 615 阅读 · 0 评论 -
Pandas 11-多表联合
当需要将多个 DataFrame 进行联合 join 时,可以多次调用。方法默认是基于索引进行合并,但也可以通过。两种方法来进行表的合并。Pandas 提供了。原创 2024-09-03 11:35:11 · 641 阅读 · 0 评论 -
Pandas 9-绘制柱状图
可以通过Matplotlib的API来自定义柱状图的样式和标签。# 自定义柱状图plt.show()原创 2024-09-01 17:03:55 · 970 阅读 · 0 评论 -
Pandas 8-数据筛选过滤
可以使用布尔索引来筛选满足特定条件的数据。方法,可以使用类似SQL的语法进行筛选。表示或)来组合多个条件进行筛选。方法基于标签进行筛选。方法基于位置进行筛选。可以使用逻辑运算符(原创 2024-09-01 16:49:16 · 408 阅读 · 0 评论 -
Pandas 7-进行排序、多重排序
多重排序是指按多个列进行排序。可以通过传递一个列名列表给。参数来实现按不同列的升序和降序排序。除了按列排序,还可以按索引进行排序。可以通过传递一个布尔值列表给。方法按单列进行升序排序。参数按单列进行降序排序。参数来实现多重排序。原创 2024-09-01 16:46:30 · 383 阅读 · 0 评论 -
Pandas 6-采用函数进行数据填充
假设希望将缺失的Name列填充为’Unknown’,将缺失的Age列填充为该列的平均值,将缺失的City列填充为’Unknown’,将缺失的Score列填充为该列的中位数。#### 2.2 应用填充函数使用`apply`方法将填充函数应用到DataFrame的每一列。```python。原创 2024-09-01 16:41:11 · 373 阅读 · 0 评论 -
Pandas 5-单元格填充日期
Pandas提供了多种日期操作方法,例如提取年份、月份、日等。首先,需要创建一个包含日期的DataFrame。在实际数据中,经常会遇到缺失的日期。生成连续的日期序列,并填充缺失的日期。方法,可以将字符串转换为日期类型。访问器来格式化日期。原创 2024-09-01 15:53:11 · 274 阅读 · 0 评论 -
Pandas 4-数据区域读取填充内容
在数据处理过程中,经常会遇到缺失值。Pandas提供了多种方法来填充或处理缺失值。对于数值型数据,可以使用插值方法来填充缺失值。原创 2024-09-01 15:50:31 · 231 阅读 · 0 评论 -
Pandas 4-数据区域读取填充内容
在数据处理过程中,经常会遇到缺失值。Pandas提供了多种方法来填充或处理缺失值。对于数值型数据,可以使用插值方法来填充缺失值。原创 2024-09-01 15:49:57 · 347 阅读 · 0 评论 -
Pandas 3 -行列单元格的基本操作
通过以上方法,可以使用Pandas对Series和DataFrame进行行、列和单元格的操作。这些操作在数据处理和分析过程中非常有用,可以帮助方便地处理和分析数据。原创 2024-09-01 15:43:56 · 332 阅读 · 0 评论 -
Pandas 2-读取文件
CSV(Comma-Separated Values)是一种常见的文件格式,用于存储表格数据。JSON(JavaScript Object Notation)是一种轻量级的数据交换格式。Excel文件是一种广泛使用的电子表格文件格式。方法来读取Excel文件。需要注意的是,读取Excel文件需要安装。如果需要从SQL数据库中读取数据,Pandas提供了。HTML文件可以用于网页展示数据。方法来读取HTML文件中的表格数据。库,并确保数据库连接正常。方法来读取JSON文件。方法来读取CSV文件。原创 2024-09-01 15:39:19 · 411 阅读 · 0 评论 -
Pandas 1- 创建文件
首先,需要创建一个DataFrame。DataFrame是Pandas中最常用的数据结构,类似于一个二维表格或SQL表。CSV(Comma-Separated Values)是一种常见的文件格式,用于存储表格数据。方法来将DataFrame保存为Excel文件。需要注意的是,保存为Excel文件需要安装。如果需要将数据保存到SQL数据库中,Pandas提供了。方法来将DataFrame保存为JSON文件。方法来将DataFrame保存为HTML文件。方法来将DataFrame保存为CSV文件。原创 2024-09-01 15:36:10 · 402 阅读 · 0 评论