题目描述
有一个文件,包含以一定规则写作的文本,请统计文件中包含的文本数量。
规则如下:
-
文本以”;”分隔,最后一条可以没有”;”,但空文本不能算语句,比如”COMMAND A; ;”只能算一条语句。注意,无字符/空白字符/制表符都算作”空”文本;
-
文本可以跨行,比如下面,是一条文本,而不是三条;
COMMAND A
AND
COMMAND B;
- 文本支持字符串,字符串为成对的单引号(')或者成对的双引号(“),字符串可能出现用转义字符()处理的单双引号(“your input is””)和转义字符本身,比如
COMMAND A "Say \"hello\"";
- 支持注释,可以出现在字符串之外的任意位置注释以”–“开头,到换行结束,比如:
COMMAND A; --this is comment
COMMAND --comment
A AND COMMAND B;
注意字符串内的”–“,不是注释。
输入描述
文本文件
输出描述
包含的文本数量
用例
输入
COMMAND TABLE IF EXISTS "UNITED STATE";
COMMAND A GREAT (
ID ADSAB,
download_length INTE-GER, -- test
file_name TEXT,
guid TEXT,
mime_type TEXT,
notifica-tionid INTEGER,
original_file_name TEXT,
pause_reason_type INTEGER,
resumable_flag INTEGER,
start_time INTEGER,
state INTEGER,
folder TEXT,
path TEXT,
total_length INTE-GER,
url TEXT
);
输出
2
解题思路
- 遍历每一行:
- 遍历累积的文本中的每一个字符,使用一个计数器来跟踪文本的数量。
- 使用两个布尔变量
inString
和inComment
来分别跟踪当前位置是否在字符串或注释内部。
- 处理注释:
- 如果当前字符和下一个字符都是减号
-
,并且不在字符串内,则标记为注释开始。 - 在注释内部,忽略所有字符直到遇到换行符,然后标记注释结束。
- 如果当前字符和下一个字符都是减号
- 处理字符串:
- 如果遇到单引号或双引号,并且不在字符串内,标记为字符串开始,并记录使用的分隔符。
- 在字符串内部,如果再次遇到相同的分隔符,检查是否为转义字符(即是否