
Python可以使用切片(slicing)来访问特定范围内的元素(即使用两个索引,并用冒号分隔)
例如
tag = '<a href="https://blog.youkuaiyun.com/Hudas">Hudas Blog</a>'
tag[9:36] # 'https://blog.youkuaiyun.com/Hudas'
tag[38:-4] # 'Hudas Blog'
注意:切片提供两个索引来指定切片的边界,其中第一个索引指定的元素包含在切片内,但第二个索引指定的元素不包含在切片内
切片操作可用于列表list
L = ['A', 'B', 'C', 'D', 'E']
# L[0:3]表示,从索引0开始取,直到索引3为止,但不包括索引3(左闭右开)
L[0:3] # ['A', 'B', 'C']
# 如果第一个索引是0,还可以省略
L[:3] # ['A', 'B', 'C']
L[1:3] # ['B', 'C']
L[-2:] # ['D', 'E']
# 倒数第一个元素的索引是-1
L[-2:-1] # ['D']
# 要复制整个序列,可将两个索引都省略
# 只写[:]就可以原样复制一个L
L[:] # ['A', 'B', 'C', 'D', 'E']
执行切片操作时,如果第一个索引指定的元素位于第二个索引指定的元素后面,结果就为空序列
numbers = [1,2,3,4,5,6,7,8,9,10]
numbers[-3:0] # []
如果切片结束于序列末尾,可省略第二个索引
numbers = [1,2,3,4,5,6,7,8,9,10]
numbers[-3:] # [8, 9, 10]
如果切片开始于序列开头,可省略第一个索引
numbers = [1,2,3,4,5,6,7,8,9,10]
numbers[:3] # [1, 2, 3]
执行切片操作时,还有一个参数叫步长
在普通切片中,隐式指定步长为1
numbers = [1,2,3,4,5,6,7,8,9,10]
numbers[0:3] # [1, 2, 3]
numbers[0:3:1] # [1, 2, 3]
我们可以显示指定步长
numbers = [1,2,3,4,5,6,7,8,9,10]
numbers[0:10] # [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
numbers[0:10:2] # [1, 3, 5, 7, 9]
numbers[0:10:4] # [1, 5, 9]
注意: 步长不能为0,否则无法向前移动
numbers = [1,2,3,4,5,6,7,8,9,10]
# ValueError: slice step cannot be zero
numbers[0:10:0]
列表切片赋值
name = list('Andy') # ['A', 'n', 'd', 'y'] name[1:] = list('BCD') name # ['A', 'B', 'C', 'D'] name[1:] = list('abcde') name # ['A', 'a', 'b', 'c', 'd', 'e']
使用切片赋值还可以在不替换原有元素的情况下插入新元素
numbers = [1,5] numbers[1:1] = [2,3,4] numbers # [1, 2, 3, 4, 5]
采取相反的措施来删除切片
numbers = [1,2,3,4,5] numbers[1:4] = [] numbers # [1, 5]
切片操作可用于元组tuple
# 元组的切片也是元组,就像列表的切片也是列表一样
tup = (0,1,2,3)
tup[:3] # (0, 1, 2)
切片操作可用于字符串str
# 字符串的切片也是字符串,就像列表的切片也是列表一样
str = 'ABCDEFG'
str[:3] # 'ABC'
str[::2] # 'ACEG'
练习案例
import pandas as pd
df = pd.DataFrame([[1,'FOC','WK10_Q217'],
[2,'ACD','WK11_Q217'],
[3,'TED','WK12_Q217']
],columns=['Id','Site','Wk_odin'])
# 获取Id和Wk_odin两列
df = df[['Id','Wk_odin']]
# 对'Wk_odin'栏位中的值进行截取修改
df['Wk_odin'] = df['Wk_odin'].apply(lambda x:x[-4:])
df
处理后的df