目录
常用数据类型:
1.series 一维,带标签数组
2.dataframe 二维,series 容器
pandas之Series
pandas之series创建
pandas之Series切片和索引
pandas之series的索引和值
pandas之读取外部数据
import pandas as pd
### csv
pd.read_csv()
### mysql
pd.read_sql(sql_sentence,connection)
### mongodb
from pymongo import MongoClent
client = MongoClient()
collection = client["donban"]["tv1"]
data = list(collection.find())
t1 = data[0]
t1 = pd.Series(t1)
pandas之dataframe
pandas之dataframe的创建
传入字典创建数据
dataframe的描述信息
dataframe的索引
import pandas as pd
df = pd.read_csv("./dogNames2.csv")
#dataframe中排序的方法
df = df.sort_values(by="Count_AnimalName",ascending=False)
# print(df.head(5))
# pandas取行或者取列的注意点
# - 方括号写数组,表示取行,对行进行操作
# - 写字符串,表示的去列索引,对列进行操作
print(df[:20])
print(df["Row_Labels"])
pandas之loc
pandas之iloc
pandas之布尔索引
import pandas as pd
# pandas读取csv中的文件
df = pd.read_csv("./dogNames2.csv")
# &且 |或
print(df[(800<df["Count_AnimalName"])&(df["Count_AnimalName"]<1000)])
pandas之字符串方法
# 转为列表
print(df["info"].str.split("/").tolist())
缺失数据的处理
inplace = True 对之前的dataframe原地修改,就地修改