python slice的几个小点总结

本文详细介绍了Python中序列切片(slice)的使用方法,包括基本语法、逆序访问及步长控制等内容,帮助读者深入理解并灵活运用切片操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近在看python时发现python中关于序列的操作,尤其slice的用法挺特别的,遂上网又细细查了查资料,感觉这篇文章总结的很好,就转载下来,留个记录。原文地址


问题的起因

    今天在写代码的时候,看到一个比较有意思的写法。假设我们有一个list,它的内容是a = [0, 1, 2, 3, 4, 5, 6, 7, 8 ,9]。如果我们取它反转后的结果,一般我们头脑里默认想到的无非就是reverse这样的方法了。但是它还有一种写法:a[::-1],输出的结果是和当前的结果相反。在某些情况下,它的应用还是比较有意思的。就想针对这一块总结一下。

slice在python中的应用

     在python中,list, tuple以及字符串等可以遍历访问的类型都可以应用slice访问。slice本身的意思是指切片,在这些可以遍历访问的类型中截取其中的某些部分。比如如下的代码:

Python代码 
  1. >>> l = range(10)  
  2. >>> l  
  3. [0123456789]  
  4. >>> l[1:5]  
  5. [1234]  

   首先,我们通过range(10) 生成一个从0到9的列表。在这个列表中取[1:5]的时候返回的是索引1到4的。所以,我们发现他们所取的slice是一个半开半闭的区间。l[a:b]==> l[a, b).

    前面这种情况下,是我们已知列表的长度,然后取他们的某个区段,如果我们不知道列表的长度,或者列表长度的获取比较麻烦呢?如果用其他的语言,我们可能考虑这个列表是否应该有一个list.length之类的属性了。在这里,有另外一个办法来取得:

Python代码 
  1. >>> l[-1]  
  2. 9  
  3. >>> l[1:-1]  
  4. [12345678]  
  5. >>> l[2:-2]  
  6. [234567]  

    我们可以看到如果要取列表中的最后一个元素,可以用l[-1]的方式,如果从后面向前,可以依次取l[-2], l[-3]...

    既然我们前面提到,在列表中slice是取的一个前面闭合后面开放的区间,也就是说我在l[a:b]的时候,索引值为b的那个元素是不包含在结果中的。如果我们想要包含后面的值那么该怎么办呢?

    这个问题可以分为几种情况来考虑,一个是加入b本身长度比较小,那么我们取l[a:b+1]就好了。比如说如下:

Python代码   收藏代码
  1. >>> l[1:3]  
  2. [12]  
  3. >>> l[1:4]  
  4. [123]  

 如果我们想把索引值为3的也包含进来,我们就用l[1:4]就行了。那么,对于处在列表末尾的元素呢?用过c, java开发的人会想到,按照这种方式会不会导致访问数组越界呢?我们试试看吧:

Python代码   收藏代码
  1. >>> len(l)  
  2. 10  
  3. >>> l[1:10]  
  4. [123456789]  
  5. >>> l[1:11]  
  6. [123456789]  
  7. >>> l[1:12]  
  8. [123456789]  

    len(l)返回l的长度。我们原来潜意识的认为,既然数组长度为10,那么我们访问的索引最大值也不过为l[9]。实际上,在python这里,可以列出的访问下标值超出数组长度范围,只不过仅仅返回能遍历到的元素而已。

    当然,我们还有另外一种办法:

Python代码   收藏代码
  1. >>> l[1:]  
  2. [123456789]  

    这种方式就完全将前面索引到数组末尾的元素都包含进来了。

    这样,我们要包含整个数组中的元素就可以采用如下的几种方式:

Python代码   收藏代码
  1. >>> l[0:]  
  2. [0123456789]  
  3. >>> l[:]  
  4. [0123456789]  
  5. >>> l  
  6. [0123456789]  

    从前面我们用l[a:b] 的方式来访问元素来看,我们这里a, b取的值要么满足0<= a <= b 或者 a >= 0 b < 0。实际上,a所对应元素的位置总是在b所对应位置的后面。那么,如果我们把他们的顺序倒过来一下会怎么样呢?比如说:

Python代码   收藏代码
  1. >>> l[5:2]  
  2. []  
  3. >>> l[-1:3]  
  4. []  

    在这里,我们发现,如果实际取的元素先从右边开始然后到左边的话,并不是我们所期望的返回一个倒过来的数组,而是返回一个空的数组。我举的这个例子有什么用呢?别急,看了后面那一节你就知道了。

理解extended slice

    前面那一部分相对来说还是比较好理解的。现在,如果我们有一些其他的要求,比如说,我们想返回数组里面索引为奇数的元素,或者索引为偶数的元素,那么该怎么办呢?

我们可以有几种办法来做,其中的一种就是采用extended slice,一个典型的解决方法如下:

Python代码   收藏代码
  1. >>> l[::2]  
  2. [02468]  
  3. >>> l[1::2]  
  4. [13579]  
  5. >>>   

    前面这种包含两个冒号的样式是怎么回事呢?

     实际上,我们这边第一个冒号隔开的这两个部分和前面的意思是一样的,就是指定数组中间元素的区间。所以前面第一个l[::2]前面就是指的整个数组的元素。而后面那个部分则是指的一个步长。这表示什么意思呢?就是既然我们前面指定的是整个数组,那么它就是从0开始,然后每次访问后面相邻的元素。而设置为2之后呢,则访问后面和它距离为2的元素,而不是直接相邻的元素。这样,我们也就容易理解l[1::2],它就是从元素1开始到结尾的元素集合里取间隔为2的这些元素。

    到这一步,就离我们理解前面那个古怪的l[::-1]很接近了。我们前面的这个取步长是将步长设置为正数,所以在取元素的集合里它表示从左到右的取指定步长覆盖的元素。如果我们将步长设置为负数呢?我们来看:

Python代码   收藏代码
  1. >>> l[1:9:-1]  
  2. []  
  3. >>> l[9:1:-1]  
  4. [98765432]  

    有了前面这一部分的代码,相信就不难理解了。我们取区间[1, 9),结果取步长为-1的时候返回的是一个空的集合。而我们取9到1的时候,步长为-1取出来了倒序的数组。这是因为如果我们指定的步长为负数的话,那么它必须和数据指定的区间方向一致。也就是说,如果我们前面指定的区间是从数组小的索引到大的索引,那么我指定的步长必然也要从小到大。所以必须为正数。而如果我们指定的区间是从后面往前的话,则步长必须指定为负数。否则返回的结果都是空的数组。

总结

    有了前面那么多的讨论,我们再来看数组的slice访问。他们无非就是这么几个情况,在l[a:b]的情况下,必须保证a所在的索引位置在前,b所在的索引位置在后,否则返回结果为空。在l[a:b:step]的情况下,我们首先要根据a, b的位置来判断方向,a在前,b在后的话,step应该为正,否则应该为负。不符合这些情况的话,则返回空的数组。也就是说,看a, b的位置来确定方向,不要犯方向性的错误,否则就竹篮打水一场空了:)

<think>嗯,用户想知道如何把bin文件分割成多个部分,他们可能是在处理大文件传输或者存储的问题吧。首先,我需要回忆一下常见的分割方法和工具。系统自带的命令应该比较方便,比如Linux下的split命令,这个在引用1里提到过,可以用来均匀分割文件。用户可能用的是Linux或者macOS,也可能是Windows的WSL环境。 然后,用户可能需要跨平台的方法,比如用Python脚本。引用2里的Python代码示例可以分割二进制文件,这个应该更灵活,适合不同操作系统。另外,用户可能关心如何验证分割后的文件是否正确,这时候用md5sum或者其他哈希值校验,像引用1里说的,合并后检查哈希值是否一致,这样能确保文件完整性。 还要考虑用户的实际应用场景,比如他们分割的是模型文件还是其他类型的二进制数据。如果是模型文件,分割后的合并可能需要保持顺序,这时候split命令的按大小分割可能需要确保顺序正确。此外,用户可能想知道有没有图形化工具,虽然问题里没提,但或许可以推荐一些常用软件,比如HJSplit,适合不熟悉命令行的用户。 需要提醒用户注意分割后的文件命名和存储路径,避免覆盖原有文件。同时,合并的时候要按正确的顺序,否则文件会损坏。另外,分割大小的选择也很重要,如果是要适应存储介质的大小,比如分割成1GB的块,可能需要调整slice_size参数。 可能用户没有提到但需要注意的点是,分割后的文件数量是否有限制,比如文件名后缀的生成方式。比如split命令默认是两位字母后缀,如果分割超过676个文件可能会出问题,这时候需要用其他选项调整。 总结一下,回答应该包括命令行工具(split和cat)、Python脚本方法、验证完整性的步骤,以及注意事项。同时,生成相关问题可以帮助用户深入了解更多细节,比如如何自动合并或者处理大文件的其他技巧。</think>### 如何将BIN文件拆分为多个部分? #### 方法1:使用Linux/macOS系统命令 `split` 通过系统自带的 `split` 命令,可按指定大小或数量均匀拆分文件。 ```bash # 按大小拆分(例如每个片段100MB) split -b 100M input.bin output_part_ # 按数量拆分(例如拆分为3个均匀片段) split -n 3 input.bin output_part_ ``` 拆分后的文件名格式为 `output_part_aa`, `output_part_ab` 等。合并时使用 `cat output_part_* > merged.bin`,并通过 `md5sum` 验证完整性[^1]。 --- #### 方法2:使用Python脚本 通过自定义Python代码实现灵活控制,适合跨平台操作。 ```python import os bin_path = 'input.bin' output_dir = 'split_parts' os.makedirs(output_dir, exist_ok=True) chunk_size = 1024 * 1024 # 1MB per chunk count = 0 with open(bin_path, 'rb') as fr: while True: chunk = fr.read(chunk_size) if not chunk: break with open(f"{output_dir}/part_{count}.bin", 'wb') as fw: fw.write(chunk) count += 1 ``` 此脚本将文件按1MB大小拆分,保存为 `part_0.bin`, `part_1.bin` 等[^2]。 --- #### 方法3:图形化工具(如HJSplit) 适用于不熟悉命令行的用户,工具如 [HJSplit](http://www.hjsplit.org/) 支持可视化操作。 --- #### 验证文件完整性 合并后需检查哈希值是否一致: ```bash md5sum original.bin md5sum merged.bin ``` 若哈希值相同,则拆分合并成功。 ---
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值