4.28 早 集合,文件操作(1)

本文介绍了Python中的集合特性,包括唯一性、不支持索引和删除重复元素的功能。通过`set()`创建集合,`list(set(num2))`实现列表去重并排序。此外,讲解了不可变集合`frozenset`的使用。还涉及文件操作,如`open()`函数的`r+`模式,以及文件读取、定位和关闭。强调了编码问题,指出在处理文本时需注意编码方式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

集合

集合中的元素具有唯一性 ,集合不支持索引 ,不能用num1[2],关键字:{,,,}
eg:
在这里插入图片描述
输出:
在这里插入图片描述

set():创建集合

在这里插入图片描述
输出:
在这里插入图片描述

将列表中重复的元素删除

在这里插入图片描述
输出:
在这里插入图片描述

在这里插入图片描述
num2本身是列表,set(num2)是集合,list(set(num2))是经过一次集合的变换后的列表,默认自动从小到大排好顺序
输出:
在这里插入图片描述

访问集合中的值 :可用循环也可用in , not in

add():往集合中添加元素

使用: .add()
eg:
在这里插入图片描述
输出:
在这里插入图片描述

不可变集合frozenset

eg:
在这里插入图片描述

文件操作

open(): 打开文件

eg:
在这里插入图片描述
r+:可读可写
在这里插入图片描述
encoding="utf-8"要加上 否则报错——错误的意思是:Unicode的解码(Decode)出现错误(Error)了,以gbk编码的方式去解码(该字符串变成Unicode),但是此处通过gbk的方式,却无法解码(can’t decode )。“illegal multibyte sequence”意思是非法的多字节序列,即没法(解码)了。

此种错误,可能是要处理的字符串本身不是gbk编码,但是却以gbk编码去解码 。比如,字符串本身是utf-8的,但是却用gbk去解码utf-8的字符串,所以结果不用说,则必然出错。

通过查阅资料,有提出在读取文本的时候加入参数‘b’,不会提示错误

read(字节数) :读取文件,一个中文字符占2个字节

seek():

f.seek(offset,from) from(0代表文件起始位置,1代表当前位置,2代表文件末尾)偏移offset个字节

close():关闭文件,一定打开和关闭配套使用

在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值