head first python（第五章）–学习笔记

最新推荐文章于 2025-08-12 18:06:10 发布

转载最新推荐文章于 2025-08-12 18:06:10 发布 · 88 阅读

0 ·

CC 4.0 BY-SA版权

原文链接：https://segmentfault.com/a/1190000002767377

文章标签：

#python

本文详细介绍了Python中数据排序的多种方式，包括原地排序、复制排序和方法串联等，并通过实例展示了如何处理数据不一致问题及优化代码。同时，文章还介绍了推导列表在简化代码过程中的应用，以及如何进行数据筛选、删除重复项和数据截取。最后，文章还讲解了如何使用列表分片获取所需数据，并提供了几种删除重复项的方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.排序有两种方式

原地排序（in-place sorting），按指定的顺序排列数据，然后用排序后的数据替换原来的数据。原来的顺序会丢失。

sort()

复制排序（copied sorting）,按你指定的顺序排序，然后返回原数据的一个有序副本。原数据的顺序依然保留。

sorted()

方法串联（method chaining）

第一个方法应用到数据中，然后再将处理好的数据应用到第二个方法中。从左向右读。

例子：

data.strip().split(',')

函数串联（function chaining）

每个函数会取得数据，对他完成某个操作，然后把转换后的数据继续向下传递到下一个函数。从右向左读。

例子：

print(sorted(james))

2.数据不一致导致排序中出现问题，需要整理数据

创建一个函数，传入时间参数，然后将不一致的（-，：）数据清除掉，然后将其分割为分和秒，然后整合在一起，形成统一时间格式 MM:SS 。

def sanitize(time_string):
    if '-' in time_string:
        splitter = '-'
    elif ':' in time_string:
        splitter = ':'
    else:
        return(time_string)
    (mins, secs) = time_string.split(splitter)
    return(mins + '.' + secs)

然后修改代码

def sanitize(time_string):
    if '-' in time_string:
        splitter = '-'
    elif ':' in time_string:
        splitter = ':'
    else:
        return(time_string)
    (mins, secs) = time_string.split(splitter)
    return(mins + '.' + secs)

with open('james.txt') as jaf:
    data = jaf.readline()
james = data.strip().split(',')

with open('julie.txt') as juf:
    data = juf.readline()
julie = data.strip().split(',')

with open('mikey.txt') as mif:
    data = mif.readline()
mikey = data.strip().split(',')

with open('sarah.txt') as saf:
    data = saf.readline()
sarah = data.strip().split(',')

clean_james = []
clean_julie = []
clean_mikey = []
clean_sarah = []

---------臃肿的部分------------
for each_t in james:
    clean_james.append(sanitize(each_t))

for each_t in julie:
    clean_julie.append(sanitize(each_t))

for each_t in mikey:
    clean_mikey.append(sanitize(each_t))

for each_t in sarah:
    clean_sarah.append(sanitize(each_t))

print(sorted(clean_james))
print(sorted(clean_julie))
print(sorted(clean_mikey))
print(sorted(clean_sarah))
---------臃肿的部分------------

3.不过代码看来十分臃肿，学会使用推导列表

clean_mikey = []

for each_t in mikey:
    clean_mikey.append(sanitize(each_t))

变成

clean_mikey = [sanitize(each_t) for each_t in mikey]

新列表         转换方法            for循环       列表

append动作隐含在里面了。

推导列表有点奇怪，不过写多几次就熟悉了。

[m * 60 for m in mins]

[s.upper() for s in lower]

[float(s) for s in clean]

使用推导列表后，程序简化了

print(sorted([sanitize(t) for t in james]))
print(sorted([sanitize(t) for t in julie]))
print(sorted([sanitize(t) for t in mikey]))
print(sorted([sanitize(t) for t in sarah]))

4.只需要前三项数据

可以使用列表分片
如：

james[0:3]

5.删除重复项

有2种方法：
1.用集合的方法，集合的特性是数据是无序的，而且不允许重复。

james = {10.6,11,10.6}

distances = set（james）  #set()就是集合的方法

这样distances出来的数据就是无序且不重复的。

2.用遍历的方法

unique_james = []
for each_t in james:
    if each_t not in unique_james:  #判断是否在数组中，不在就放进新的数组
        unique_james.append(each_t)

BTW：
python中有两种类型的列表，一种是可以改变的列表（用中括号包围），一种是不可改变的列表（用小括号包围）-叫元组tuple，还有一种不是列表，是集合，用大括号包围。

原文引用：http://www.godblessyuan.com/2015/04/27/head_first_python_chapter_5_lea...