GitHub仓库:https://github.com/15crmor/PAC
项目要求
-
基本要求
-
-c 统计文件字符数 (实现)
-
-w 统计文件词数 (实现)
-
-l 统计文件行数(实现)
-
-
扩展功能
- -s 递归处理目录下符合条件得文件(实现)
- -a 返回文件代码行 / 空行 / 注释行(实现)
-
高级功能
- -x 图形化界面(未实现)
解题思路
- 实现对文本的统计
-
- 读取文件
- 使用正则表达式处理文本内容
- 再实现拓展功能更复杂的统计及批量操作
- 用os模块获取文件以及判断是文件或目录
- 遍历目录下所有符合的文件
- 最后实现命令参数解析
- 用sys模块实现在命令行解析参数
设计
- 将各个功能放在不同文件中
- 主文件及相应模块
- WC.py:
- recursive(list) (遍历文件)
- wc(f, arg) (实现命令参数解析)
- WC.py:
- 统计字符文件及模块
- strCount.py:
- str_count(name)
- strCount.py:
- 统计行数文件及模块:
- lineCount.py:
- line_count(name)
- lineCount.py:
- 统计单词文件及模块:
- wordsCount.py:
- words_count(name)
- wordsCount.py:
- 统计代码行/空行/注释行文件及模块:
- codeCount.py:
- code_count(name)
- codeCount.py:
- 主文件及相应模块
流程图
代码说明
1. 遍历文件
def recursive(list): f_list = os.listdir(list) return f_list
2. 统计字符数
def str_count(name): with open(name, 'r', encoding='UTF-8') as f: n = 0 for line in f.readlines(): n += len(line) return n
3. 统计行数
def line_count(name): with open(name, 'r', encoding='UTF-8') as f: n = 0 for line in f: n += 1 return n
4. 统计单词数
import re def words_count(name): with open(name, 'r', encoding='UTF-8') as f: n = 0 for line in f.readlines(): list_match = re.findall('[a-zA-Z]+', line.lower()) n += len(list_match) return n
5. 统计空行/代码行/注释行数
def code_count(name): with open(name, 'r', encoding='UTF-8') as f: code_lines = 0 comm_lines = 0 space_lines = 0 for line in f.readlines(): if line.strip().startswith('#'): comm_lines += 1 elif line.strip().startswith("'''") or line.strip().startswith('"""'): comm_lines += 1 elif line.count('"""') == 1 or line.count("'''") == 1: while True: line = f.readline() comm_lines += 1 if ("'''" in line) or ('"""' in line): break elif line.strip(): code_lines += 1 else: space_lines += 1 return code_lines, comm_lines, space_lines
6. 命令行逻辑
def wc(f, arg): if arg[1] == '-c': str_num = str_count(f) print(f + "文件字符数为: ", str_num) elif arg[1] == '-w': word_num = words_count(f) print(f + "文件单词数为:", word_num) elif arg[1] == '-l': line_num = line_count(f) print(f + "文件行数为:", line_num) elif arg[1] == '-a': code_lines_num, comm_lines_num, space_lines_num = code_count(f) print(f + "文件代码行为:", code_lines_num) print("注释行为:", comm_lines_num) print("空行为:", space_lines_num)
测试运行
由于事先设置了工作路径所以默认路径与代码所在路径不同
- 基本模块测试
- 扩展模块测试
- 递归遍历文件夹下文件测试
- 文件名出错时
代码覆盖率
PSP
PSP2.1 | Personal Software Process Stages | 预估耗时(分钟) | 实际耗时(分钟) |
Planning | 计划 | 60 | 60 |
· Estimate | · 估计这个任务需要多少时间 | 60 | 60 |
Development | 开发 | 300 | 360 |
· Analysis | · 需求分析 (包括学习新技术) | 60 | 100 |
· Design Spec | · 生成设计文档 | 30 | 30 |
· Design Review | · 设计复审 (和同事审核设计文档) | 20 | 30 |
· Coding Standard | · 代码规范 (为目前的开发制定合适的规范) | 30 | 20 |
· Design | · 具体设计 | 30 | 30 |
· Coding | · 具体编码 | 240 | 300 |
· Code Review | · 代码复审 | 30 | 40 |
· Test | · 测试(自我测试,修改代码,提交修改) | 60 | 60 |
Reporting | 报告 | 20 | 30 |
· Test Report | · 测试报告 | 60 | 60 |
· Size Measurement | · 计算工作量 | 20 | 20 |
· Postmortem & Process Improvement Plan | · 事后总结, 并提出过程改进计划 | 20 | 30 |
合计 |
| 1040 | 1220 |
项目总结
以前写代码从没考虑过这么多,总是思考一阵之后便直接上手,遇到什么问题就查书查网上资料解决,突然想改就把之前写的模块推翻重来,因此也做了不少无用功,而且也很少总结,现在这样虽然工作量多了但是却感觉比以前开发要更快,少走了不少弯路,而且有写了博客后也感觉比之前掌握的更加扎实。