import pandas as pd
from pandas import DataFrame,Series
import numpy as np
from numpy import nan as NA
import matplotlib.pyplot as plt
import sys#在控制台输出
用pandas保存文件
data文件中各个文件数据
读取文件
df=pd.read_csv("data/ex1.csv")#默认逗号分隔
df
pd.read_table("data/ex1.csv",sep=",")#默认为/t分隔
pd.read_csv("data/ex2.csv",header=None)#默认从0开始
- 读写文本格式的文件
• 如何读取没有标题的文件内容?
• 办法1:让pandas自动为其分配
列名
• 办法2:手动为其分配列名
pd.read_csv("data/ex2.csv",names=["a","b","c","d","m"])#自己定义列明
pd.read_csv("data/ex2.csv",names=["a","b","c","d","m"],
index_col="m")#如果希望将message作为其索引,需要手工指定
# 加载数据,创建层次化索引数据结构
series = pd.read_csv("data/csv_mindex.csv",
index_col=["key1","key2"])
series
# 如果csv文文件的分隔符是不规则的,则可以考虑用正则进行分割
list(open("data/ex3.txt"))
result = pd.read_table("data/ex3.txt",sep="\s+")
result
剩下的就不一一去写了
pandas保存数据
pandas-高级篇-数据的聚合与分组计算