Pandas的基本属性
1.import pandas as pd #先导入数据pandas 库
import numpy as np #导入数据numpy 库

2.爬虫:
import requests
url =“http://…”
header={" "}
response = requests.get(url, headers=header)
html=response.text
pd.read_json(html)[[“列1,列2”]]

4.From pandas import Series,DataFrame #导入series及DataFrame

5.type(s) # 查看s 类型

Pandas中的索引与切片
我们以a = Series([4,5,6,7],index = [“a”,“b”,“c”,“d”]) 创造数组:
-
a,b,c,d,为索引;

-
a[“b”] 指a的b列 ;a.b sql 也有这种方法 ;a.get(“b”) series 特有的get(); a[1] 切片第二个值;pandas中用索引找对应的值4种方式

-
两种a[ ]切片对比: a[[“b”]] 2个括号是序列:索引+值,a[“b”] 一个中括号是索引切的值。

-
a[“b”:“d”] 与a[“b”,“d”] 与excel中的counta(a:b) 和counta(a,b) 相似,但是提多列时加[ ]。

-
查看a中第一个索引; 查看a>3 所有的序列

-
改变索引,也可以用a.index=[0,1,2,3] 直接在原数据上改。

-
条件判断,筛选a中大于3 的值,返回的是布尔值 ,也可以对大于3的值求和。


-
np中有exp 表示以e为底,的3,4,5,6次方。

-
判断a中是否有空值,返回的是布尔值,是可以运算求和的。

-
将a中的列表,改成dataframe 表格形式,如果在之前没有导入datafame,series ,可以用b = pd.Dateframe代替。

DataFrame 的格式
-
原型由Series/列表构造,但是Series 是没有columns 的( 图1),只能用DataFrame里的(图2)。
图1

图2

-
另外一种书写方法:“c” 与 “a” 中表示列名= columns 。

-
{{ }} 2个花括号表示二维数组,[[ ]] 表示二维列表 ,2015,2016,2017表示行的序列;

Pandas 的 查看与读写
-
把b 写入out1.csv 中,以"," 为分隔符,header 标题带不带进去 ,查看写进入之后的结果,用pd.read_csv查看。

-
所有pd所支持查看的read 形式,主要有 csv,excel,html,json,sas,spss,sql,table 。


-
重置索引,只有在np 的格式下,将arange换成由1到N 的索引值,直接改变了原数据的索引。

-
pd.read_csv 直接读取数据,将在python 里的文件路径放进去,非本盘加r。

-
json 格式读取html ,pd.read_json(html)。

-
用json格式去爬虫,显示html 网页,pd.read_json(html)之后得到列表,要用list 去接。

-
list接住之后,找出源代码中的data 的"list" 列表,找出values,再转化为元组或者字典的格式,之后进行DataFrame转化为表格。

-
可以从dataFrame 中查看from_records(e)的记录,此时的数据为2维,要加上[[ ]] 2个括号。

-
爬html 表,直接放链接,之前是本地的表格,所以不用转化dataframe 格式。

-
pd.read_clipboard() 表示读取爬虫网页的html

-
txt 的读取,可以用scv, 自动修改columns 或者index,原数据发生改变。

pandas 的数据查看
- data . head(2) 表示查看前2条数据。

- data.tail(2) 表示查看后2条数据。

23.data.info()

- dtypes 表示查看类型,object ,str ,bool, int

PS:
撤销:Ctrl/Command + Z
重做:Ctrl/Command + Y
加粗:Ctrl/Command + B
斜体:Ctrl/Command + I
标题:Ctrl/Command + Shift + H
无序列表:Ctrl/Command + Shift + U
有序列表:Ctrl/Command + Shift + O
检查列表:Ctrl/Command + Shift + C
插入代码:Ctrl/Command + Shift + K
插入链接:Ctrl/Command + Shift + L
插入图片:Ctrl/Command + Shift + G
查找:Ctrl/Command + F
替换:Ctrl/Command + G
本文介绍Pandas库的基础操作,包括数据的导入、索引与切片、DataFrame格式转换等,并演示了如何通过Pandas进行数据查看与读写。
293





