设计相应的数据结构和算法,尽量高效的统计一片英文文章(总单词数目)里出现的所有英文单词, * 按照在文章中首次出现的顺序打印输出该单词和它的出现次数。

本文介绍了一个简单的Java程序,用于统计文本中每个英语单词出现的频率。通过使用两个HashMap数据结构,该程序能够有效地处理和记录单词及其对应的出现次数。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

package com.hao.test;

import java.util.HashMap;

/**
 *
 * @author zhanghaohao089
 * @date 2017/8/16
 */

public class QueryEnglishWord {
    private HashMap<String, Integer> hashMap = new HashMap<>();
    private HashMap<Integer, Word> hashWord = new HashMap<>();
    private int count = 0;

    public void insert(String content) {
        String[] array = content.split(" ");
        String name;
        for (int i = 0; i<array.length; i++) {
            name = array[i].trim();
            if (name.length() > 0 ) {
                if (name.indexOf("...") > -1) {
                    name = name.replace("...", "");
                }

                if (name.indexOf(".") > -1) {
                    name = name.replace(".", "");
                }

                for (int j = 0; j < 10; j++) {
                    if (name.indexOf(""+j) > -1) {
                        name = "";
                        break;
                    }
                }
            }
            if (name.length() > 0) {
                if (hashMap.get(name) != null) {
                    int index = hashMap.get(name);
                    Word word = hashWord.get(index);
                    word.setCount(word.getCount() + 1);
                    hashWord.put(index, word);
                } else {
                    hashMap.put(name, ++count);
                    Word word = new Word();
                    word.setName(name);
                    word.setCount(1);
                    hashWord.put(count, word);
                }
            }
        }
    }

    public void println() {
        for (int i = 1; i<= count; i++) {
            System.out.println("单词为---" + hashWord.get(i).getName() + "   出现的次数---" + hashWord.get(i).getCount());

        }
    }
}
package com.hao.test;

/**
 * description
 *
 * @author zhanghaohao089
 * @date 2017/8/16
 */

public class Word {
    private String name;
    private int count;

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public int getCount() {
        return count;
    }

    public void setCount(int count) {
        this.count = count;
    }
}

node:
1、先判断…符号再判断.符号

至于为什么要用hashMap来储存,因为hashMap在已知条件的情况下,存取极快,修改快,没有删除操作

数据结构 优点 缺点
数组 插入快 查找慢、删除慢、大小固定
有序数组 查找快 插入慢、删除慢、大小固定
栈 后进先出 存取其他项很慢
队列 先进先出 存取其他项很慢
链表 插入、删除快 查找慢
二叉树 查找、插入、删除快 算法复杂(删除算法)
红黑树 查找、插入、删除快 算法复杂
hash表 存取极快(已知关键字)、插入快 删除慢、不知关键字时存取很慢、对存储空间使用不充分
堆 插入快、删除快、对大数据项存取快 对其他数据项存取慢
图 依据现实世界建模 算法有些复杂
AVL树 查找、插入、删除快 算法复杂

为了在C语言中实现一个有序表统计特定英文单词在文本中的出现次数位置,首先需要设计合适的数据结构来存储单词有序表,然后实现相应算法来处理文本执行统计。以下是一步步详细的方法: 参考资源链接:[文学研究助手:数据结构课程设计中的英文小说词频统计](https://wenku.youkuaiyun.com/doc/3e5s00kd1d?spm=1055.2569.3001.10343) 1. **数据结构设计**: - **单词结构体(Word)**:包含一个字符数组一个整型变量记录出现次数。字符数组用于存储单词,整型变量用于记录该单词在文本中出现的次数。 ```c typedef struct { char *text; // 单词的字符序列 int count; // 单词出现的次数 } Word; ``` - **有序表结构体(OrderList)**:包含一个Word类型的数组用于存储单词,以及一个整型变量记录当前有序表中单词的数量。 ```c typedef struct { Word *words; // 存储单词的数组 int size; // 有序表中的单词数量 } OrderList; ``` 2. **算法实现**: - **初始化有序表(InitList)**:创建一个初始大小的Word数组,并初始化size为0。 ```c void InitList(OrderList *list, int initialCapacity) { list->words = (Word *)malloc(initialCapacity * sizeof(Word)); list->size = 0; } ``` - **单词插入(Insert)**:将新单词插入有序表中。如果单词已存在,则增加其出现次数;如果不存在,则添加到有序表中,并保持列表的有序性。 ```c void Insert(OrderList *list, Word newWord) { // 实现插入逻辑,保持有序表的排序性质 } ``` - **单词查找(Search)**:通过二分查找或哈希表查找特定单词是否存在于有序表中,并返回其索引。 ```c int Search(OrderList *list, const char *text) { // 实现查找逻辑 } ``` - **文本处理**:读取文本文件,利用字符串处理技术(如`strtok`)分割字符串并统计单词。 ```c void ProcessTextFile(const char *filename, OrderList *list) { // 实现读取文件统计单词的逻辑 } ``` - **输出结果**:遍历有序表,打印出每个单词的文本、出现次数位置信息。 ```c void PrintResults(const OrderList *list) { // 实现输出逻辑,遍历有序表并打印每个单词的信息 } ``` 3. **用户交互文件I/O**: - 设计用户界面接收输入的文件名统计单词集。 - 使用文件I/O操作读取文本文件,进行单词统计。 通过这个详细的实现框架,可以构建出一个完整的系统,来处理英文文本的单词统计任务。这个过程中,你将深入理解数据结构的使用、算法的应用以及软件开发的完整流程。 参考资源链接:[文学研究助手:数据结构课程设计中的英文小说词频统计](https://wenku.youkuaiyun.com/doc/3e5s00kd1d?spm=1055.2569.3001.10343)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值