华为OD机试D卷C卷 - 文本统计分析(C++ Java JavaScript Python C语言)

这篇博客介绍了华为OD机试中的一道文本统计分析题目,要求统计符合特定规则的文本数量。规则包括分号分隔、字符串、注释等。博主提供了C++、Java、JavaScript、Python和C语言的解题思路和代码示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目描述

有一个文件,包含以一定规则写作的文本,请统计文件中包含的文本数量。

规则如下:

  1. 文本以”;”分隔,最后一条可以没有”;”,但空文本不能算语句,比如”COMMAND A; ;”只能算一条语句。注意,无字符/空白字符/制表符都算作”空”文本;

  2. 文本可以跨行,比如下面,是一条文本,而不是三条;

COMMAND A
AND
COMMAND B;
  1. 文本支持字符串,字符串为成对的单引号(')或者成对的双引号(“),字符串可能出现用转义字符()处理的单双引号(“your input is””)和转义字符本身,比如
COMMAND A "Say \"hello\"";
  1. 支持注释,可以出现在字符串之外的任意位置注释以”–“开头,到换行结束,比如:
COMMAND A; --this is comment
COMMAND --comment
A AND COMMAND B;

注意字符串内的”–“,不是注释。

输入描述

文本文件

输出描述

包含的文本数量

用例

输入

COMMAND TABLE IF EXISTS "UNITED STATE";
COMMAND A GREAT (
ID ADSAB,
download_length INTE-GER, -- test
file_name TEXT,
guid TEXT,
mime_type TEXT,
notifica-tionid INTEGER,
original_file_name TEXT,
pause_reason_type INTEGER,
resumable_flag INTEGER,
start_time INTEGER,
state INTEGER,
folder TEXT,
path TEXT,
total_length INTE-GER,
url TEXT
);

输出

2

题意解读

题目要求编写一个程序来统计一个文本文件中包含的文本数量。这里的“文本”指的是符合一定规则的字符串序列。具体规则如下:

  1. 文本以分号(;)分隔,最后一条文本可以没有分号结尾。

  2. 如果一段文本只包含空白字符(如空格、制表符等),则不算作一条有效文本。例如,"COMMAND A; ;"中只有一条有效文本。"COMMAND A; B;"为两条有效文本。

  3. 文本可以跨越多行。也就是说,一个文本的内容可以分布在多个连续的行中,这些行合起来算作一条文本。

  4. 文本支持字符串,字符串可以用单引号(')或双引号(")包裹。字符串内部可能包含转义的引号(例如"Say \"hello\"")和转义字符本身(例如\)。

  5. 在单引号和双引号的;

评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

算法大师

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值