listfile.exe 用正则表达式来找文件

介绍了一款基于正则表达式的文件搜索工具,可在Windows环境下进行文件和目录的批量操作,支持彩色输出及多种实用参数。

背景

最近的工作里,涉及到不少目录之间的批量操作(产品的部署、文件夹之间的同步等等)。工作的环境是 Win XP,没有自带诸如 Linux 下 find 这样方便的工具。当然,我在我自己的环境里安装了 Cygwin,但我不能要求其他同事仅仅为了使用这个命令而也装一个 Cygwin。而且,find 是用通配符去匹配文件名,我一直幻想着用正则表达式来匹配文件名/目录,所以我趁周末开发这个小工具。程序已经写好了,并发布到了 Google Code 上,主页是 http://code.google.com/p/listfile/ 。如下图:

正如下面版权里写的,你可以对这个程序/代码做任何你想做的事情:将这个工具用于你的工作中;拿源代码去交作业;向你的<(男|女)?朋友们?> 炫耀你开发/找到了一个好玩的东西……

使用方法

lf [OPTIONS] PATTERN...

描述

lf 通过给定的模式来列出文件(或目录),类似 UNIX 系统下的 find (1) 命令,不过 find (1) 是用统配符来匹配文件名。比如:星号(*)代表零到多个字符;问号(?)代表单个任意字符。不过,用于匹配路径的话,正则表达式的功能更强大也更灵活。另一个好玩的特性是 lf 可以输出彩色信息,就像 UNIX 里 ls --color=auto 一样。

参数

-a, --all
    显示所有文件(包括隐藏文件)。

-A, --absolute-path
    输出的文件路径显示为绝对路径。
 
-e, --exec command
    执行命令。可以通过<1> .. <n>来引用前面匹配的路径的每一项,而<0>则匹配完整路径。
    此外,可以通过用逗号分隔范围中的第一个和最后一个数字指定一系列连续的文件名。因此<0>和<1,n>是等价的。
 
-h, --help 
    显示这个帮助文档,并退出。

-i, --ignore-case
    匹配时忽略大小写。

-r, --relative-path 
    输出的文件路径显示为相对路径(相对于当前路径)。 

模式

模式表达式同时支持通配符和正则表达式,其中正则表达式要放在尖括号里(“<”和“>”)。

环境变量

USERPROFILE

 

变量%UserProfile%是 MS Windows NT系统中一个特殊环境变量,它的值是当前用户配置文件所在的目录(类似UNIX下的HOME目录)。

退出值

正常情况下为零,否则为非零。

例子

1. lf "workspaces/project<[1-9]>/src/*.cpp" -e "copy <0> backup/<2,4>"

依次把 project1 到 project9 下的 src 文件夹里的 C++ 源文件备份到 backup 目录下相应的 project*/src 目录下,并且文件名保持一致。

版权

这个程序引用了微软的正则表达式库 GRETA 2.6.4 ,和它相关的东西你要遵循 GRETA 自己的协议。不过,由我写的那部分代码你可以随意使用,你甚至可以告诉你的<(男|女)?朋友们?>(这也是个正则表达式,哈哈)这个程序是你写的!我只希望这个小玩意儿能帮你节省点时间。


版权声明

请尊重原创作品。转载请保持文章完整性,并以超链接形式注明原始作者“redraiment ”和主站点 地址,方便其他朋友提问和指正。

联系方式

我的邮箱,欢迎来信(redraiment@gmail.com
我的Blogger(子清行 ):http://redraiment.blogspot.com/
我的Google Sites(子清行 ):https://sites.google.com/site/redraiment
我的优快云博客(梦婷轩 ):http://blog.youkuaiyun.com/redraiment
我的百度空间(梦婷轩 ):http://hi.baidu.com/redraiment

这是一个“普通文本型”问题,直接回答如下: --- ### 实验分析与实现思路 实验要求使用 `Scanner` 类结合正则表达式统计英文文本中的单词信息,包括: 1. 单词总数; 2. 不重复的单词数量; 3. 按出现频率从高到低输出单词。 #### 实现步骤(Java语言示例): ```java import java.io.File; import java.io.FileNotFoundException; import java.util.*; public class WordCounter { public static void main(String[] args) { File file = new File("english.txt"); // 假设文件名为 english.txt Map<String, Integer> wordCount = new HashMap<>(); try (Scanner sc = new Scanner(file)) { // 设置分隔符为非字母字符(只保留字母组成的单词) sc.useDelimiter("[^a-zA-Z]+"); while (sc.hasNext()) { String word = sc.next().toLowerCase(); // 转小写统一处理 if (!word.isEmpty()) { wordCount.put(word, wordCount.getOrDefault(word, 0) + 1); } } } catch (FileNotFoundException e) { System.out.println("文件到,请检查路径!"); return; } // (1) 统计总单词数 int totalWords = wordCount.values().stream().mapToInt(Integer::intValue).sum(); System.out.println("总单词数:" + totalWords); // (2) 不同单词的数量 int uniqueWords = wordCount.size(); System.out.println("不同单词数:" + uniqueWords); // (3) 按频率从高到低排序输出 List<Map.Entry<String, Integer>> sortedList = new ArrayList<>(wordCount.entrySet()); sortedList.sort((a, b) -> b.getValue().compareTo(a.getValue())); // 按频率降序 System.out.println("按频率排序的单词:"); for (Map.Entry<String, Integer> entry : sortedList) { System.out.println(entry.getKey() + ": " + entry.getValue()); } } } ``` #### 文件内容示例(`english.txt`): ``` Hello world! This is a test. Hello Java, this is fun. Test the world of Java programming. ``` #### 输出结果示例: ``` 总单词数:14 不同单词数:11 按频率排序的单词: hello: 2 is: 2 this: 2 java: 2 world: 2 test: 2 a: 1 fun: 1 the: 1 of: 1 programming: 1 ``` --- ### 相关知识点详解 1. **Scanner类的useDelimiter方法** 使用正则表达式设定分隔符,如`[^a-zA-Z]+`表示连续非字母字符作为分隔,精准提取单词。 2. **HashMap统计频次** 利用键值对存储单词及其出现次数,`getOrDefault`简化计数逻辑,高效实现词频统计。 3. **集合排序(List + Comparator)** 将Map转为List后通过`sort`和自定义比较器按值排序,实现频率从高到低输出。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值