python数据分析_Python数据分析,文本数据如何读取?

本文介绍了如何使用Python进行数据处理,包括CSV和TXT文件的读取与存储。通过`pd.read_csv()`和`pd.read_table()`函数读取CSV和TXT数据,利用正则表达式处理分隔符,并展示了如何使用`df.to_csv()`导出清洗后的数据。通过实例代码,详细解析了数据导入导出的过程,为数据分析初学者提供了实践指导。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在家无聊,不如跟我一起学Python,从数据获取、数据清洗,到数据探索、数据可视化,我会的都会分享,不会的我会继续学习,学无止境,今天分享的是文本数据的导入,一起学习吧!

一、CSV文件读取


打开原始的数据如下所示,通过写代码读取数据,当我们处理的数据量很大时,通过写代码的方式,简洁并且高效。

2410965d46d60988de339941859b5259.png

程序代码都放到代码框里了

大家一定要动手多练练

!type D:python数据分析数据shuju1.csv #查看数据情况
!type D:python数据分析数据shuju1.csv #查看数据情况
4830cf3afca109a7f304ad9f084cd5aa.png
df = pd.read_table(open('D:/python数据分析/数据/shuju1.csv'),sep=',') #指定分隔符df
069c76b019c0bfc16ca2633177f46625.png
df = pd.read_csv(open('D:/python数据分析/数据/shuju1.csv'),index_col='id') #指定行索引df
7c352144a5bc57f809c2a8812e570885.png
df = pd.read_csv(open('D:/python数据分析/数据/shuju1.csv'),index_col='id') #指定行索引df
7bf13e7bb6daf2c64d7cba4465302814.png

二、TXT文件读取


除了数值型数据,这种文本数据在数据分析时,也占了很大的比重,比如商品评论分析,网站舆情监测分析,前期都要做很多文本数据的处理,数据处理的好坏,关乎到数据结果,本例的文本数据如下

4f2b3eb657030b3d54d0c1fa2b3599c4.png
!type D:python数据分析数据shuju3.txt #数据情况
!type D:python数据分析数据shuju3.txt #数据情况
079a3e7ec306c472adec2573909979c5.png
!type D:python数据分析数据shuju3.txt #数据情况
23158d557e34fa1e195efc712145b423.png
df = pd.read_table(open('D:/python数据分析/数据/shuju3.txt'),sep='s+') #正则表达式的使用df
76c7ab158cf7512963e8e03a97efb638.png
df = pd.read_table(open('D:/python数据分析/数据/shuju3.txt'),sep='s+') #正则表达式的使用df
452a964fc408f4e3dd5b60bef8175af7.png

三、文本数据存储


数据清洗阶段完成后,可以将“干净”的数据导出,作为一个新样本研究,其研究质量会有大幅度的提升。

df.to_csv('D:/python数据分析/数据/out1.csv') #存储文本数据!type D:python数据分析数据out1.csv
990644c67da5aab848ec290eb09de4e3.png
df.to_csv('D:/python数据分析/数据/out2.csv',sep='?') #指定分隔符,存储文本数据!type D:python数据分析数据out2.csv
6c9844415132b1da75877bbb7e9df1ca.png
df.to_csv('D:/python数据分析/数据/out3.csv',index=False) #处理行和列索引!type D:python数据分析数据out3.csv
59e9a6d017c9f7c0aee286cb616dd524.png
df.to_csv('D:/python数据分析/数据/out3.csv',index=False) #处理行和列索引!type D:python数据分析数据out3.csv
f0a6215355ca927246904539d5a87759.png
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值