力扣 - 194.转置文件(transpose-file)

原创于 2024-08-17 15:04:05 发布 · 508 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#leetcode

编程参考专栏收录该内容

100 篇文章

订阅专栏

. - 力扣（LeetCode）

给定一个文件 file.txt，转置它的内容。

你可以假设每行列数相同，并且每个字段由 ' ' 分隔。

示例：

假设 file.txt 文件内容如下：

name age

alice 21

ryan 30

应当输出：

name alice ryan

age 21 30


awk '{ #这个大括号里的代码是 对正文的处理

    # NF表示列数，NR表示已读的行数

    # 注意for中的i从1开始，i前没有类型

    for (i=1; i<=NF; i++){#对每一列

        if(NR==1){       #如果是第一行

            #将第i列的值存入res[i],$i表示第i列的值，i为数组的下标，以列序号为下标，

            #数组不用定义可以直接使用

            res[i]=$i;   

        }

        else{

            #不是第一行时，将该行对应i列的值拼接到res[i]

            res[i]=res[i] " " $i

        }

    }

}

# BEGIN{} 文件进行扫描前要执行的操作；END{} 文件扫描结束后要执行的操作。

END{

    #输出数组

    for (i=1; i<=NF; i++){

        print res[i]

    }

}' file.txt

可以将上述代码直接拷贝在控制台执行，也可以将其内容拷贝在shell脚本文件中执行。

#!/bin/bash

....

题解：

awk是一行一行地处理文本文件，运行流程是：

1，先运行BEGIN后的{Action}，相当于表头

2，再运行{Action}中的文件处理主体命令

3，最后运行END后的{Action}中的命令

有几个经常用到的awk常量：NF是当前行的field字段数；NR是正在处理的当前行数。

注意到是转置，假如原始文本有m行n列（字段），那么转置后的文本应该有n行m列，即原始文本的每个字段都对应新文本的一行。我们可以用数组res来储存新文本，将新文本的每一行存为数组res的一个元素。

在END之前我们遍历file.txt的每一行，并做一个判断：在第一行时，每碰到一个字段就将其按顺序放在res数组中；从第二行开始起，每碰到一个字段就将其追加到对应元素的末尾（中间添加一个空格）。

文本处理完了，最后需要输出。在END后遍历数组，输出每一行。注意printf不会自动换行，而print会自动换行。