文件名排序

本文探讨了不同系统中文件名排序的实现方式,包括busybox、Linux shell里的coreutils、Freedos及Windows cmd等,揭示了它们使用strcmp进行排序的原理,并对比了Windows Explorer的不同行为。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

转载时请注明出处和作者联系方式:http://blog.youkuaiyun.com/mimepp
作者联系方式:YU TAO <yut616 at sohu dot com>

关键字: ls, cmd, dir, freedos, busybox

 

在各个不同的系统中,对文件名的排序有着不同的实现,这里做个记录。

 

现象:

11.txt

5.txt

对这两个的排序,linux会将 5.txt 排在 11.txt 后面,这个结果对非电脑爱好者,就很奇怪了,5应该比11小,却排在了后面。

 

1、busybox

轻量级的 busybox 的实现,就是直接用了 strcmp

coreutils/ls.c

static int sortcmp(const void *a, const void *b)

 

 

2、linux shell 里 coreutils

coreutils-7.4/src/ls.c

#define DEFINE_SORT_FUNCTIONS(key_name, key_cmp_func)

也是使用的 strcmp

 

3、freedos 里面,dir 命令,如: dir /ON

freecom/cmd/dir.c

qsort(orderIndex, orderCount, sizeof(orderIndex[0]), orderFunction);
static int orderFunction(const void *p1, const void *p2)

同样也是用的 strcmp

 

4、windows cmd

也一样,结果是 11.txt 排在了 5.txt 的前面

 

5、windows explorer

windows xp版本以后,5.txt 排在了11.txt  前。

也就是说,是将文件名中的数字是以数字来进行对比,而不是将数字作为字符来对比。

而且,cmd 和 资源管理器 结果还居然是不同的。

可以参考:

http://blogs.msdn.com/b/michkap/archive/2005/01/05/346933.aspx

### Linux 和 Python 中的文件名排序方法 #### 使用 Linux 命令行工具进行文件名排序Linux 环境中,可以利用 `ls` 命令配合 `-X` 参数来实现基于文件扩展名或其他特定部分的排序。对于更复杂的排序需求,比如依据版本号或者其他自定义模式,则可以通过管道符结合其他命令如 `sort` 来完成[^1]。 例如,如果想要按照文件名中的数字部分而非整个名称来进行升序排列: ```bash ls | sort -V ``` 这条指令会启用自然数排序功能(`-V`),从而正确处理带有数字序列的情况。 #### 利用 Python 进行高级文件名排序 当面对更加复杂的要求时,Python 提供了灵活的方式来定制化文件名排序逻辑。特别是针对那些包含特殊字符或非连续编号的情形,可以直接读取目录内容并应用适当的键函数作为比较标准[^2]。 考虑这样一个场景:有一系列视频文件名为 `'file_1.mp4'`, `'file_2.mp4'`, ..., `'file_10.mp4'`。为了确保这些文件能够被正确定位和播放顺序不乱,下面这段代码展示了如何使用 Python 实现这一点: ```python import os def natural_keys(text): ''' alist.sort(key=natural_keys) sorts in human order http://nedbatchelder.com/blog/200712/human_sorting.html (See Toothy's implementation in the comments) ''' import re convert = lambda text: int(text) if text.isdigit() else text.lower() alphanum_key = lambda key: [convert(c) for c in re.split('([0-9]+)', key)] return alphanum_key files = ['file_1.mp4', 'file_2.mp4', 'file_10.mp4'] files.sort(key=natural_keys) print(files) ``` 上述脚本首先导入必要的模块,接着定义了一个辅助函数 `natural_keys()` 用于解析字符串中的整数值以便于后续对比;最后调用了列表对象自带的 `.sort()` 方法,并指定该函数作为关键字参数传递给它,实现了预期的效果——即根据实际含义而不是简单的ASCII码值大小决定先后次序[^4]。 另外,在某些情况下可能还需要考虑到文件的时间属性等因素。此时可借助操作系统接口提供的 API 获取相应信息,并将其纳入到最终的排序考量之中[^3]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值