python编程基础02

本文介绍了Python编程中的文件读取与写入,包括Pandas库读取CSV、Excel、TXT文件的方法及参数。接着,详细讲解了Series和DataFrame数据结构,以及常用的基本函数,如数据汇总、信息查看、统计分析、数据去重、替换、排序等。还探讨了窗口对象,如滑动窗口、扩张窗口的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、文件读取与写入

1、文件读取
pandas的文件读数功能较多,可以读多种格式的数据:
在这里插入图片描述

一般情况下会读取csv,excel,txt文件。

读取本地文件:

file=pandas.read_csv('/Users/l/Desktop/sample.csv')
print(file.head())

在这里插入图片描述
读取txt文件:

df=pd.read_table('/Users/l/Desktop/result3.txt',sep='\t',names=['ap_categories','ssid','bssid','uuid_count','time'])#可以添加间隔符sep,列名

读取Excel文件:

file = pandas.read_excel('/Users/l/Desktop/user_ap_bs_poi/all.xlsx',nrows=200)#读取200行数据

读取Excel的速度会比CSV文件慢一些,可能与Excel文件有多个sheet有关.
读文件时的参数:
header=None 表示第一行不作为列名
index_col 表示把某一列或几列作为索引
usecols 表示读取列的集合,默认读取所有的列
parse_dates 表示需要转化为时间的列
nrows 表示读取的数据行数

文件写入:
我们处理完的数据需要保存为新的数据,需要写到笨地文件夹中:

pivot_file.to_csv('/Users/l/Desktop/数据验证/pivot_table.csv')

将数据中的行索引去除:

pivot_file.to_csv('/Users/l/Desktop/数据验证/pivot_table.csv',index=False)

保存为txt:

pivot_file.to_csv('/Users/l/Desktop/数据验证/pivot_table.txt',sep='\t',index=False)#用csv的方式,定义分隔符

转换为markdown或者latex:
先安装tabulate包:

import pandas
data=pandas.read_csv('/Users/l/Desktop/test.csv')

print(data.to_markdown())

在这里插入图片描述

print(data.to_latex())

在这里插入图片描述
2、基本数据结构
Series和Dataframe

series:
在这里插入图片描述

1/data
2/index
3/dtyp
4/name

a=pandas.Series(data=[1,2,'q',[4,5],{'name':'chen'}],index=[1,2,3,4,5],
                   dtype='object',name='chen')
print(a)


1                   1
2                   2
3                   q
4              [4, 5]
5    {'name': 'chen'}
Name: chen, dtype: object

可以通过.的方式获取series的属性:

print(a.values)
print(a.index)
print(a.dtype)
print(a.name)


[1 2 'q' list([4, 5]) {'name': 'chen'}]
Int64Index([1, 2, 3, 4, 5], dtype='int64'
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值