pandas操作

最新推荐文章于 2024-12-29 22:36:11 发布

原创最新推荐文章于 2024-12-29 22:36:11 发布 · 2.4k 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#1024程序员节

知识补充专栏收录该内容

13 篇文章

订阅专栏

本文介绍了如何使用Pandas的read_csv()函数读取CSV文件，并展示了如何处理数据列。通过示例，展示了如何创建DataFrame，获取列信息以及将列转换为列表。此外，还演示了如何获取DataFrame的列名及其数据类型。

一、pandas读入csv文件
1、pd.read_csv（）读入csv文件。

import numpy as np

data = pd.read_csv('./input/covid.train.csv')
x = data[data.columns[1:94]]
y = data[data.columns[94]]

2、columns用法
使用pandas处理列表的时候，调用上面的表头信息。
（1）建立一个excel形式文件

df = pd.DataFrame([[1, 2, 3]], columns=list("ABC"))

输出：

   A  B  C
0  1  2  3

（2）获得表头信息：

col = df.columns # 获取到的col是<class 'pandas.core.indexes.base.Index'>

输出

Index(['A', 'B', 'C'], dtype='object')

（3）获得列表形式表头

（3）col = df.columns.values # 返回结果是数组

输出

['A' 'B' 'C']

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Marshal～

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Pandas教程：详解如何使用Pandas操作数据库

旦莫的博客

07-28

3152

在数据分析的工作流程中，数据的获取、处理和存储是至关重要的。Python 的 Pandas 库提供了强大的数据处理能力，而数据库（如 MySQL、PostgreSQL 等）则是高效存储和管理数据的工具。本文将详细介绍如何使用 Pandas 操作数据库，包括数据库读取数据、写入数据、更新和删除数据、实际案例和注意事项。

Python数据分析与机器学习实战-07.pandas索引与计算

qq_39817865的博客

09-10

261

通过pandas获取筛选数据的方法：可以选择索引切片，也可以通过字段名筛数据：筛选数据： 1.索引的形式：（1）一个索引：food_info.loc[0] （2）多个索引：food_info.loc[3:6]；food_info.loc[[2,5,10] 2.通过字段名：food_info["NDB_No"]；food_info[["Zinc_(mg)", "Copper_(mg)"...

参与评论您还未登录，请先登录后发表或查看评论

python Pandas库基础

qq_46841701的博客

02-13

2274

目录Pandas入门序列（Series）创建序列对象序列的查询操作序列的属性 Pandas入门注意：使用 Pandas 库之前应先掌握一定 NumPy 库知识，Pandas 库是基于 NumPy 库上的。使用 Pandas 库需先导入 pandas 模块，习惯性，我们将导入后的模块重新命名为 pd。 import pandas as pd 下面，我们主要学习 pandas 中的两种数据结构。序列（Series）序列与字典类似。字典的键值对在序列中相当于 index - value 。我们可以先看

Pandas常用基本操作---第一节

高志远的博客

08-11

1847

Pandas基本操作本文的所有试验均基于jupyter notebook 使用Pandas读取csv文件并显示 import pandas as pd #读取csv数据文件 food_info = pd.read_csv('food_info.csv') #查看数据类型 DataFrame数据类型是pandas的核心数据类型之一 print(type(food_info)) #查看数据 f...

猿创征文｜数据导入与预处理-第3章-pandas基础

IT从业者的成长历程

09-08

2663

关于pandas的基本介绍，包括Series，DataFrame，Index对象，还介绍了统计计算和绘制图形的基本方法

5 用Pandas库处理数据（Series和DataFrame）

Emily的博客

11-25

1653

从书、一些博主的分享上学习的笔记！

数据分析三剑客之Pandas

X工作室

07-25

579

超万字总结，绝对干货！！一定要收藏！

pandas操作excel

最新发布

qq_45488501的博客

12-29

877

通过以上内容，你可以全面掌握Pandas操作Excel的各种方法，无论是简单的数据读取和写入，还是复杂的数据清洗、分析和处理，Pandas都能成为你高效处理Excel数据的得力工具。pivot_table = pd.pivot_table(df, index='列1', values=['列2', '列3'], aggfunc='mean')df = pd.read_excel('data.xlsx', usecols=['列1', '列3'])使用merge()方法按指定列合并两个DataFrame。

Python3 pandas 操作列表实例详解

09-18

以上内容就是关于Python3中使用Pandas操作列表的详细实例解析，通过这些操作实例，我们可以对Pandas在数据分析工作中的作用有一个更为直观和深入的理解。希望这些知识点能够对大家的学习和工作提供帮助，并请大家...

精选资源

forkkk:pandas操作Excel

05-14

标题 "pandas操作Excel" 涉及到的是在Python中使用pandas库对Excel文件进行数据处理。pandas是一个强大的数据分析工具，它提供了一系列高效、灵活的函数和方法，使得处理Excel这样的表格数据变得非常方便。以下是...

两万字总结python之pandas库

浪里小白龙nbw的博客

08-09

1793

为什么要学习pandas? 那么问题来了： numpy已经能够帮助我们处理数据，能够结合matplotlib解决我们数据分析的问题，那么pandas学习的目的在什么地方呢？ numpy能够帮我们处理处理数值型数据，但是这还不够，很多时候，我们的数据除了数值之外，还有字符串，还有时间序列等。比如：我们通过爬虫获取到了存储在数据库中的数据所以，pandas出现了。什么是Pandas? Pandas的名称来自于面板数据（panel data） Pandas是一个强大的分析结构化数据的工具集，基于.

Pandas数据拼接操作merge、join、concat、append

我是天才很好

10-18

1099

文章目录1.concat方法1.1 测试参数axis、join和ignore_index1.2 测试axes参数：自定义轴2.merge方法2.1 merge方法的两种写法例子1：merge方法的两种写法例子2：测试merge的不同连接方向：outer、left（df1和df2的值与例1相同）例子3：当两表中选中的列名不同时，使用left_on和right_on代替参数on2.2 测试valida...

1数据分析库pandas的使用

AIHUBEI的博客

03-12

829

Pandas 的使用 author by xiaoyao Numpy提供了方便的数组处理功能，但其缺少的是：数据处理、分析所需要的快速工具。pandas基于Numpy开发，提供了很多的高级数据处理功能。 import pandas as pd import numpy as np # pd.set_option("display.show_dimensions", False) # pd.set_...

pandas使用速查表

timeless_go的博客

05-16

1111

github持续更新中数据类型数据类型意义 Series 一维数组, 类型相同 DataFrame 二维表格数据类型, 理解为Series的容器 Panel 三维数组, 理解为 DataFrame 的容器创建对象方法意义 pd.Series([1,3,4,np.nan,6,8]) 用列表创...

【学习笔记】Python大数据处理与分析——pandas数据分析

有为肥宅的博客

04-17

1278

pandas数据分析学习，作笔记使用

Python 数据分析三剑客之 Pandas（二）：Index 索引对象以及各种索引操作

marraybug的博客

07-06

1270

Pandas学习笔记-核心知识整理

光逝的博客

05-16

1515

一、DataFrame 1. 常用基本方法及属性 df.info() 输出总行数、各列的行数、类型、索引、占用内存等信息； df.index 输出索引，为 pandas.core.indexes.range.RangeIndex 类型； df.columns 输出列名，为pandas.core.indexes.base.Index 类型，可使用df.columns.str ； df.dt...

pandas 操作技巧

09-20

Pandas 是一个开源的数据分析工具库，提供了丰富而强大的操作技巧，下面将介绍一些常用的 pandas 操作技巧。 1. 数据读取与写入：使用 pandas 可以方便地读取和写入不同格式的数据文件，如 CSV、Excel、数据库等。只需使用对应的读取函数（如 read_csv()、read_excel()）和写入函数（如 to_csv()、to_excel()）即可。 2. 数据清洗与处理：pandas 提供了丰富的数据处理功能，如处理缺失值、重复值、异常值等。处理缺失值可以使用 dropna() 删除包含缺失值的行或列，使用 fillna() 填充缺失值；处理重复值可以使用 duplicated() 判断是否重复，再使用 drop_duplicates() 删除重复值；处理异常值可以使用条件判断或使用正则表达式等方法。 3. 数据选择与切片：pandas 可以灵活地选择和切片数据，使得数据的访问和操作更加简便。可以使用 loc[] 和 iloc[] 选择指定行或列，也可以使用条件判断选择特定条件下的数据。 4. 数据合并与拼接：pandas 提供了多种方式实现数据的合并和拼接操作，如使用 merge() 按照指定的键进行合并，使用 concat() 进行行或列的拼接，使用 join() 进行索引的连接等。 5. 数据分组与聚合：pandas 可以根据指定的条件进行数据分组，并进行聚合操作，如求和、求均值、求最大值等。可以使用 groupby() 对数据进行分组，再使用 agg()、sum()、mean() 等函数进行聚合运算。 6. 数据可视化：pandas 也提供了简单而强大的数据可视化功能，通过 DataFrame 的 plot() 方法可以直接绘制各种图表，如折线图、柱状图、散点图等。以上是一些常用的 pandas 操作技巧，掌握这些技巧可以更加高效地进行数据处理和分析。当然，这仅仅是 pandas 的冰山一角，还有很多其他的功能和用法可以进一步探索和学习。