原来你竟然是这样的txt?

本文揭示了看似相同的TXT文件为何使用同一Python代码导入时出现错误,详细讲解了不同生成方式导致的内部格式差异,并提供了针对四种常见TXT格式的正确导入方法。

总第134篇/张俊红

1.前言

经常有同学问我,老师为啥同样的格式的两个文件我用同样的方法导入到Python里面,一个可以正常导入,一个却会报错,这是为什么呢?你应该也有遇到过这种情况,就是表面相同的文件,文件名完全相同,格式完全相同(至少肉眼看上去是),而且里面的内容也是一样的,但是你用同样的代码却不能打开每一个文件。

memberinfo.txt
memberinfo.txt
memberinfo.txt
memberinfo.txt

我们本篇就来讲讲这是为什么?

2.生成txt文件

要弄懂为什么会出现上面那种看起来完全一样的文件,但实际上却不能用同样的代码打开每一个文件的原因,我们首先看看这些看起来完全一样的文件是如何生成的。

主要是利用Excel中另存为格式,进行txt文件的生成。

excel文件另存为格式选择

2.1生成文本文件

将Excel文件另存为文本文件(制表符分隔(*.txt))格式的文件,这样就生成第一个memberinfo.txt文件。

2.2生成Unicode文本

将Excel文件另存为Unicode文本(*.txt)格式的文件,这样就生成了第二个memberinfo.txt文件。

2.3生成CSV文件

先将Excel文件另存为CSV(逗号分隔)(*csv)格式的文件memberinfo.csv,然后直接将文件名强制更改成memberinfo.txt,这样就生成第三个memberinfo.txt文件了。

2.4生成CSV UTF-8文件

先将Excel文件另存为CSV UTF-8(逗号分隔)(*csv)格式的文件memberinfo.csv,然后直接将文件名强制更改成memberinfo.txt,这样就生成第四个memberinfo.txt文件了。

这样大家就知道了为什么表面上看起来一样的文件,却不能用同样的代码打开,主要是因为生成的方式(内部存储格式)是不一样的。

3.导入文件

我们主要讲述一下如何用Python导入这四种不同格式的txt文件。

3.1导入文本文件

因为文本文件是用制表符(\t)进行分隔的,所以我们在read_table的时候令sep = '\t'即可。

df = pd.read_table(r"C:\Users\Desktop\memberinfo.txt",sep="\t",engine = "python",encoding="gbk")

3.2导入Unicode文本

因为Pandas不支持读写unicodeascii编码方式的文件和数据,所以要读写这两类文件时,需要先将文件格式转换成Pandas支持的utf-8或者gbk格式,更改方式如下:

  • step1:打开txt文件,选择另存为,我们可以看到红框部分的编码格式是Unicode

    第一步打开txt文件
  • step2:将文件编码格式修改为utf-8

    第二步修改txt文件编码格式

这样就可以进行正常导入了,只需要将上述的encoding从gbk改成utf-8就可以。

df = pd.read_table(r"C:\Users\Desktop\memberinfo.txt",sep="\t",engine = "python",encoding="gbk")

3.3导入CSV文件

因为这个txt文件是直接将CSV文件格式进行更改的,文件格式和CVS文件格式一致,逗号分隔(sep=","),gbk编码(encoding="gbk"),所以,导入txt文件时也需要遵循这样的格式。

df = pd.read_table(r"C:\Users\Desktop\memberinfo.txt",sep=",",engine = "python",encoding="gbk")

3.4导入CSV UTF-8文件

这个文件和上面的CSV文件唯一不同的就是编码格式不同,这个编码格式是utf-8,所以导入的时候只需要在CSV文件的基础上改一下编码格式即可。

df = pd.read_table(r"C:\Users\Desktop\memberinfo.txt",sep=",",engine = "python",encoding="utf-8")

现在你应该很清楚txt外表一样,内心不一样的原因了吧。


昨晚做了一场直播分享,讲了讲我在写『对比Excel,轻松学习Python数据分析』这本书过程中的一些心路历程。只有充分了解这本书的一个背景,你才能更好的理解本书,从而利用好本书。点击阅读原文即可报名学习。因为免费时间已过,如果你已经购买书,私聊我给你免费开通,不需要付费的哦。

内容概要:本文设计了一种基于PLC的全自动洗衣机控制系统内容概要:本文设计了一种,采用三菱FX基于PLC的全自动洗衣机控制系统,采用3U-32MT型PLC作为三菱FX3U核心控制器,替代传统继-32MT电器控制方式,提升了型PLC作为系统的稳定性与自动化核心控制器,替代水平。系统具备传统继电器控制方式高/低水,实现洗衣机工作位选择、柔过程的自动化控制/标准洗衣模式切换。系统具备高、暂停加衣、低水位选择、手动脱水及、标准两种蜂鸣提示等功能洗衣模式,支持,通过GX Works2软件编写梯形图程序,实现进洗衣过程中暂停添加水、洗涤、排水衣物,并增加了手动脱水功能、脱水等工序蜂鸣器提示的自动循环控制功能,提升了使用的,并引入MCGS组便捷性与灵活性态软件实现人机交互界面监控。控制系统通过GX。硬件设计包括 Works2软件进行主电路、PLC接梯形图编程线与关键元,完成了启动、进水器件选型,软件、正反转洗涤部分完成I/O分配、排水、脱、逻辑流程规划水等工序的逻辑及各功能模块梯设计,并实现了大形图编程。循环与小循环的嵌; 适合人群:自动化套控制流程。此外、电气工程及相关,还利用MCGS组态软件构建专业本科学生,具备PL了人机交互C基础知识梯界面,实现对洗衣机形图编程能力的运行状态的监控与操作。整体设计涵盖了初级工程技术人员。硬件选型、; 使用场景及目标:I/O分配、电路接线、程序逻辑设计及组①掌握PLC在态监控等多个方面家电自动化控制中的应用方法;②学习,体现了PLC在工业自动化控制中的高效全自动洗衣机控制系统的性与可靠性。;软硬件设计流程 适合人群:电气;③实践工程、自动化及相关MCGS组态软件与PLC的专业的本科生、初级通信与联调工程技术人员以及从事;④完成PLC控制系统开发毕业设计或工业的学习者;具备控制类项目开发参考一定PLC基础知识。; 阅读梯形图建议:建议结合三菱编程能力的人员GX Works2仿真更为适宜。; 使用场景及目标:①应用于环境与MCGS组态平台进行程序高校毕业设计或调试与运行验证课程项目,帮助学生掌握PLC控制系统的设计,重点关注I/O分配逻辑、梯形图与实现方法;②为工业自动化领域互锁机制及循环控制结构的设计中类似家电控制系统的开发提供参考方案;③思路,深入理解PL通过实际案例理解C在实际工程项目PLC在电机中的应用全过程。控制、时间循环、互锁保护、手动干预等方面的应用逻辑。; 阅读建议:建议结合三菱GX Works2编程软件MCGS组态软件同步实践,重点理解梯形图程序中各环节的时序逻辑与互锁机制,关注I/O分配与硬件接线的对应关系,并尝试在仿真环境中调试程序以加深对全自动洗衣机控制流程的理解。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

俊红的数据分析之路

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值