文章目录
持续更新中, 如有问题请随时评论指出, 共同进步~
导入文件
01 导入excel文件
os.chdir(r"C:\Users\Administrator\Desktop")
df1 = pd.read_excel("附件1:协议酒店名单发布版.xlsx", encoding="utf-8",sheetname=0)
# 现在的版本encoding="utf-8" 可有可无, sheetname是指第一个表
02 导入CSV文件
df2 = pd.read_csv('data/train-pivot.csv')
03 导入MySQL数据
import pandas as pd
import pymysql
conn = pymysql.connect(host="localhost", user="root", password="123456", db="test")
sql = "select * from emp" #emp 是table的名字
pd.read_sql(sql,conn)
04 导入postgret数据
import psycopg2
import pandas as pd
import matplotlib.pyplot as plt
conn = psycopg2.connect(dbname="re", user="postgres",password="111", host="1.1.1.1", port="5432")
sql = "select id, datetime, battery, charging, device from devicepower where id=2 and (datetime BETWEEN '2019-07-28 02:38:17' AND '2019-07-28 05:50:18') order by datetime"
df = pd.read_sql(sql,conn)
df.head(100)
Series 和 DataFrame基础使用
Series 和 DataFrame是pandas中常用的两个数据结构.
01 Series
Seires 是一维的数组型对象, 包含一个索引和一个值序列, 索引默认为0-N. 可以认为这是一个定长的有序字典, index 和 value 11对应.
import numpy as np
import pandas as pd
#建立Series
s = pd.Series([1,3,5,np.nan,6,8], index=list("abcdef"))
print(s)
# 查看前5行
print(s.head())
#查看后3行
print(s.tail(3))
# 查看index
print(s.index)
#获取所有值, 获取单个值, 获取多个值
print(s.values)