Pandas基础 - 自创

最新推荐文章于 2025-09-16 23:51:38 发布

原创最新推荐文章于 2025-09-16 23:51:38 发布 · 414 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#列表 #python #json #csv #pandas

python基础专栏收录该内容

12 篇文章

订阅专栏

本文介绍Pandas库的基础操作，包括数据的导入、索引与切片、DataFrame格式转换等，并演示了如何通过Pandas进行数据查看与读写。

pandas 基础

Pandas的基本属性

Pandas的基本属性

1.import pandas as pd #先导入数据pandas 库
import numpy as np #导入数据numpy 库
在这里插入图片描述

2.爬虫：
import requests
url =“http://…”
header={" "}
response = requests.get(url, headers=header)
html=response.text
pd.read_json(html)[[“列1，列2”]]
在这里插入图片描述

4.From pandas import Series,DataFrame #导入series及DataFrame
在这里插入图片描述

5.type(s) # 查看s 类型
在这里插入图片描述

Pandas中的索引与切片

我们以a = Series([4,5,6,7],index = [“a”,“b”,“c”,“d”]) 创造数组：

a,b,c,d,为索引；
a[“b”] 指a的b列；a.b sql 也有这种方法；a.get(“b”) series 特有的get()； a[1] 切片第二个值；pandas中用索引找对应的值4种方式
两种a[ ]切片对比： a[[“b”]] 2个括号是序列：索引+值，a[“b”] 一个中括号是索引切的值。
a[“b”:“d”] 与a[“b”,“d”] 与excel中的counta(a:b) 和counta(a,b) 相似，但是提多列时加[ ]。
查看a中第一个索引；查看a>3 所有的序列
改变索引，也可以用a.index=[0,1,2,3] 直接在原数据上改。
条件判断，筛选a中大于3 的值，返回的是布尔值，也可以对大于3的值求和。
np中有exp 表示以e为底，的3,4,5,6次方。
判断a中是否有空值,返回的是布尔值，是可以运算求和的。
将a中的列表，改成dataframe 表格形式，如果在之前没有导入datafame,series ，可以用b = pd.Dateframe代替。

DataFrame 的格式

原型由Series/列表构造，但是Series 是没有columns 的（图1），只能用DataFrame里的(图2)。
图1

图2
另外一种书写方法：“c” 与 “a” 中表示列名= columns 。
{{ }} 2个花括号表示二维数组，[[ ]] 表示二维列表，2015，2016，2017表示行的序列；

Pandas 的查看与读写

把b 写入out1.csv 中,以"，" 为分隔符，header 标题带不带进去，查看写进入之后的结果，用pd.read_csv查看。
所有pd所支持查看的read 形式,主要有 csv,excel,html,json,sas,spss,sql,table 。
重置索引，只有在np 的格式下，将arange换成由1到N 的索引值，直接改变了原数据的索引。
pd.read_csv 直接读取数据，将在python 里的文件路径放进去，非本盘加r。

在这里插入图片描述

json 格式读取html ,pd.read_json(html)。
用json格式去爬虫，显示html 网页，pd.read_json(html)之后得到列表，要用list 去接。
list接住之后，找出源代码中的data 的"list" 列表，找出values,再转化为元组或者字典的格式，之后进行DataFrame转化为表格。
可以从dataFrame 中查看from_records(e)的记录，此时的数据为2维，要加上[[ ]] 2个括号。
爬html 表，直接放链接，之前是本地的表格，所以不用转化dataframe 格式。
pd.read_clipboard() 表示读取爬虫网页的html
txt 的读取，可以用scv，自动修改columns 或者index，原数据发生改变。

pandas 的数据查看

data . head(2) 表示查看前2条数据。
data.tail(2) 表示查看后2条数据。

23.data.info()
dtypes 表示查看类型，object ，str ，bool， int

PS：
撤销：Ctrl/Command + Z
重做：Ctrl/Command + Y
加粗：Ctrl/Command + B
斜体：Ctrl/Command + I
标题：Ctrl/Command + Shift + H
无序列表：Ctrl/Command + Shift + U
有序列表：Ctrl/Command + Shift + O
检查列表：Ctrl/Command + Shift + C
插入代码：Ctrl/Command + Shift + K
插入链接：Ctrl/Command + Shift + L
插入图片：Ctrl/Command + Shift + G
查找：Ctrl/Command + F
替换：Ctrl/Command + G