统计一行英文的单词个数

题目描述

编写程序,输入一行不超过 80 个字符,统计其中有多少个单词,单词之间用空格分隔开。

输入格式

I love China!

输出格式

3

解法

定义一个标志位flag=0,遍历到第一个单词的开头时,单词数+1,标志位置1,当单词结束,遇到空格时,代表一个单词结束,标志位置0


代码示例

#include <stdio.h>
int main()
{
	char ch[81];
	int i, num = 0, word = 0;
	char c;
	gets(ch);
	for (i = 0; (c = ch[i]) != '\0'; i++)
		if (c == ' ') word = 0;
		else if (word == 0)
		{
			word = 1;
			num++;
		}
	printf("There are %d words in the line.\n", num);
	return 0;
}
统计一行文本中单词个数数组通常是将一段连续的文字拆分成单个单词,并计算每个单词出现的次数,然后形成一个数组形式的结果。这个过程涉及到自然语言处理(NLP)中的基本步骤,包括分词、去除标点符号和停用词等。 以下是一个简单的步骤概述: 1. **文本预处理**:将字符串转换为小写,以便不区分大小写;去除多余的空白字符(如换行符或制表符)。 2. **分词**:根据语言规则(例如英文空格分隔或使用正则表达式),将文本分割成单词列表。 3. **清理词汇**:移除标点符号、数字和其他非字母字符,可能还需要排除一些常见的停用词(如“的”、“是”等在大多数上下文中没有太多含义的词语)。 4. **计数**:遍历单词列表,使用哈希表(Python中的`collections.Counter`或字典)存储每个单词及其出现次数。 5. **数组表示**:最后,将统计结果转化为数组形式,元素为单词,值为对应的频率。 以下是一个简单的Python示例: ```python import re from collections import Counter def count_words(text): # 去除标点符号和转换为小写 text = re.sub(r'[^\w\s]', '', text.lower()) # 分词并计数 words = text.split() word_counts = Counter(words) # 返回单词计数组 return list(word_counts.items()) # 示例用法 text = "这是一段示例文本,包含多个单词,重复的单词会被计数。" word_array = count_words(text) print(word_array) # 输出:[('这', 1), ('是', 1), ('一段', 1), ('示例', 1), ('文本', 1), ...] ``` 如果你想要获取的是每个单词出现次数的数组,而不是元组对(单词, 出现次数),可以稍作调整,仅保留计数值部分: ```python word_counts_array = [count for word, count in word_counts] ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值