1.CSV数据
- .to_csv:保存到CSV
- 参数sep:分隔符,一般为","(默认)
- 参数header:是否保存列索引
- 参数index:是否保存行索引
import numpy as np
import pandas as pd
data = np.random.randint(0,50,size=(10,5))
df = pd.DataFrame(data=data,columns=['Python','Java','C++','C#','TypeScript'])
print(df)
df.to_csv('data.csv',sep=',',header=True,index=True)
- .read_csv:读取CSV数据
- 参数sep:分隔符,一般为","(默认)
- 参数header:指定列索引,如果为None,则第一行数据会作为内容
- 参数index:指定行索引
import numpy as np
import pandas as pd
df = pd.read_csv('data.csv',sep=',',header=[0],index_col=0)
print(df)
- .read_table:读取CSV数据
- 参数sep:分隔符,默认为'\t'
- 参数header:指定列索引,如果为None,则第一行数据会作为内容
- 参数index:指定行索引
import numpy as np
import pandas as pd
df = pd.read_table('data.csv',sep=',',header=[0],index_col=0)
print(df)
2.excel数据
- .to_excel:保存到excel文件
- 参数sheet:工作表名称
- 参数header:指定列索引,如果为None,则第一行数据会作为内容
- 参数index:是否保存行索引
import numpy as np
import pandas as pd
data = np.random.randint(0,50,size=(10,5))
df = pd.DataFrame(data=data,columns=['Python','Java','C++','C#','TypeScript'])
print(df)
#需要pip install openpyxl
df.to_excel('data.xlsx',sheet_name='Sheet1',header=True,index=True)
- .read_excel:读取excel
- 参数sheet:读取那一个工作表的内容,可以是工作表名称,也可以是索引
- 参数header:指定列索引,如果为None,则第一行数据会作为内容
- 参数names:设置或替换列明
import numpy as np
import pandas as pd
df1 = pd.read_excel('data.xlsx',sheet_name=0,header=0)
df2 = pd.read_excel('data.xlsx',sheet_name=0,header=0,names=list('ABCDE'))
print(df1)
print('###################################')
print(df2)
3.MySQL数据(代码未亲自复现)
- 安装pymysql:pip install pymysql
- 安装sqlalchemy:pip install sqlalchemy
import numpy as np
import pandas as pd
from sqlalchemy import create_engine
data = np.random.randint(0,150,size=(150,3))
df = pd.DataFrame(data=data,columns=['Python','Pandas','PyTorch'])
print(df)
#先连接MyySQL数据库,mysql_pymysql:数据库类型+驱动,root:用户名,123456:密码,localhost:主机名,db:数据库名称
create_engine('mysql_pymysql://root:123456@localhost:3306/db')
#保存到MySQL
df.to_sql(
name='score', #数据库中表名字
con=conn, #数据库连接对象
index=False, #是否保存行索引
if_exists='append' #如果表存在,追加数据
)
#读取数据
pd.read_sql(
sql = 'select * from score', #SQL语句
con = conn, #数据库连接对象
index_col = 'Python' #设置索引
)
知识点为听课总结笔记,课程为B站“千锋教育Pandas数据分析从入门到实战,零基础小白保姆级Python数据分析教程”:001_Pandas_Pandas介绍_哔哩哔哩_bilibili