Pandas基础 - 自创

本文介绍Pandas库的基础操作,包括数据的导入、索引与切片、DataFrame格式转换等,并演示了如何通过Pandas进行数据查看与读写。

Pandas的基本属性

1.import pandas as pd #先导入数据pandas 库
import numpy as np #导入数据numpy 库
在这里插入图片描述

2.爬虫:
import requests
url =“http://…”
header={" "}
response = requests.get(url, headers=header)
html=response.text
pd.read_json(html)[[“列1,列2”]]
在这里插入图片描述

4.From pandas import Series,DataFrame #导入series及DataFrame
在这里插入图片描述

5.type(s) # 查看s 类型
在这里插入图片描述

Pandas中的索引与切片

我们以a = Series([4,5,6,7],index = [“a”,“b”,“c”,“d”]) 创造数组:

  1. a,b,c,d,为索引;
    ![在这里插入图片描述](https://img-blog.csdnimg.cn/20201110165215979.png#pic_center

  2. a[“b”] 指a的b列 ;a.b sql 也有这种方法 ;a.get(“b”) series 特有的get(); a[1] 切片第二个值;pandas中用索引找对应的值4种方式
    在这里插入图片描述

  3. 两种a[ ]切片对比: a[[“b”]] 2个括号是序列:索引+值,a[“b”] 一个中括号是索引切的值。
    在这里插入图片描述

  4. a[“b”:“d”] 与a[“b”,“d”] 与excel中的counta(a:b) 和counta(a,b) 相似,但是提多列时加[ ]。
    ![在这里插入图片描述](https://img-blog.csdnimg.cn/20201110170822506.png#pic_cent

  5. 查看a中第一个索引; 查看a>3 所有的序列
    在这里插入图片描述

  6. 改变索引,也可以用a.index=[0,1,2,3] 直接在原数据上改。
    在这里插入图片描述

  7. 条件判断,筛选a中大于3 的值,返回的是布尔值 ,也可以对大于3的值求和。
    在这里插入图片描述
    在这里插入图片描述

  8. np中有exp 表示以e为底,的3,4,5,6次方。
    在这里插入图片描述

  9. 判断a中是否有空值,返回的是布尔值,是可以运算求和的。
    在这里插入图片描述

  10. 将a中的列表,改成dataframe 表格形式,如果在之前没有导入datafame,series ,可以用b = pd.Dateframe代替。
    在这里插入图片描述

DataFrame 的格式

  1. 原型由Series/列表构造,但是Series 是没有columns 的( 图1),只能用DataFrame里的(图2)。
    图1
    在这里插入图片描述
    图2
    在这里插入图片描述

  2. 另外一种书写方法:“c” 与 “a” 中表示列名= columns 。
    在这里插入图片描述

  3. {{ }} 2个花括号表示二维数组,[[ ]] 表示二维列表 ,2015,2016,2017表示行的序列;
    在这里插入图片描述

Pandas 的 查看与读写

  1. 把b 写入out1.csv 中,以"," 为分隔符,header 标题带不带进去 ,查看写进入之后的结果,用pd.read_csv查看。
    在这里插入图片描述

  2. 所有pd所支持查看的read 形式,主要有 csv,excel,html,json,sas,spss,sql,table 。
    在这里插入图片描述
    在这里插入图片描述

  3. 重置索引,只有在np 的格式下,将arange换成由1到N 的索引值,直接改变了原数据的索引。
    在这里插入图片描述

  4. pd.read_csv 直接读取数据,将在python 里的文件路径放进去,非本盘加r。

在这里插入图片描述

  1. json 格式读取html ,pd.read_json(html)。
    在这里插入图片描述

  2. 用json格式去爬虫,显示html 网页,pd.read_json(html)之后得到列表,要用list 去接。
    在这里插入图片描述

  3. list接住之后,找出源代码中的data 的"list" 列表,找出values,再转化为元组或者字典的格式,之后进行DataFrame转化为表格。
    在这里插入图片描述

  4. 可以从dataFrame 中查看from_records(e)的记录,此时的数据为2维,要加上[[ ]] 2个括号。
    在这里插入图片描述

  5. 爬html 表,直接放链接,之前是本地的表格,所以不用转化dataframe 格式。
    在这里插入图片描述

  6. pd.read_clipboard() 表示读取爬虫网页的html

  7. txt 的读取,可以用scv, 自动修改columns 或者index,原数据发生改变。
    在这里插入图片描述

pandas 的数据查看

  1. data . head(2) 表示查看前2条数据。
  2. data.tail(2) 表示查看后2条数据。
    在这里插入图片描述
    23.data.info()
    在这里插入图片描述
  3. dtypes 表示查看类型,object ,str ,bool, int
    在这里插入图片描述

PS:
撤销:Ctrl/Command + Z
重做:Ctrl/Command + Y
加粗:Ctrl/Command + B
斜体:Ctrl/Command + I
标题:Ctrl/Command + Shift + H
无序列表:Ctrl/Command + Shift + U
有序列表:Ctrl/Command + Shift + O
检查列表:Ctrl/Command + Shift + C
插入代码:Ctrl/Command + Shift + K
插入链接:Ctrl/Command + Shift + L
插入图片:Ctrl/Command + Shift + G
查找:Ctrl/Command + F
替换:Ctrl/Command + G

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值