构建与测试 colStats 工具:从开发到验证的全流程
在数据处理的世界里,我们常常需要对 CSV 文件中的特定列进行统计操作,如求和或求平均值。为了满足这一需求,我们将开发一个名为 colStats 的工具,并对其进行全面测试,确保它在各种情况下都能稳定运行。
1. 开发 colStats 工具
在开始优化之前,我们要先构建 colStats 工具并确保其正常工作。该工具接收两个可选输入参数,每个参数都有默认值:
- -col
:要执行操作的列,默认为第 1 列。
- -op
:要在选定列上执行的操作,初始支持 sum
(计算列中所有值的总和)和 avg
(计算列的平均值),后续可根据需要添加更多操作。
此外,该工具可以接受任意数量的文件名作为输入。如果用户提供多个文件名,工具会合并所有文件中同一列的结果。
以下是创建项目目录和初始化 Go 模块的步骤:
$ mkdir -p $HOME/pragprog.com/rggo/performance/colStats
$ cd $HOME/pragprog.com/rggo/performance/colStats
$ go mod init pragprog.com/rggo/performance/colStats
2. 代码组织
我们将代码组织到多个文件中,类似于开发文件系统爬虫的方式。具体创建以下三个文件:
-