设计相应的数据结构和算法，尽量高效的统计一片英文文章（总单词数目）里出现的所有英文单词， * 按照在文章中首次出现的顺序打印输出该单词和它的出现次数。

最新推荐文章于 2022-10-28 07:34:37 发布

原创最新推荐文章于 2022-10-28 07:34:37 发布 · 987 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#算法 #数据结构

java算法专栏收录该内容

8 篇文章

订阅专栏

本文介绍了一个简单的Java程序，用于统计文本中每个英语单词出现的频率。通过使用两个HashMap数据结构，该程序能够有效地处理和记录单词及其对应的出现次数。

package com.hao.test;

import java.util.HashMap;

/**
 *
 * @author zhanghaohao089
 * @date 2017/8/16
 */

public class QueryEnglishWord {
    private HashMap<String, Integer> hashMap = new HashMap<>();
    private HashMap<Integer, Word> hashWord = new HashMap<>();
    private int count = 0;

    public void insert(String content) {
        String[] array = content.split(" ");
        String name;
        for (int i = 0; i<array.length; i++) {
            name = array[i].trim();
            if (name.length() > 0 ) {
                if (name.indexOf("...") > -1) {
                    name = name.replace("...", "");
                }

                if (name.indexOf(".") > -1) {
                    name = name.replace(".", "");
                }

                for (int j = 0; j < 10; j++) {
                    if (name.indexOf(""+j) > -1) {
                        name = "";
                        break;
                    }
                }
            }
            if (name.length() > 0) {
                if (hashMap.get(name) != null) {
                    int index = hashMap.get(name);
                    Word word = hashWord.get(index);
                    word.setCount(word.getCount() + 1);
                    hashWord.put(index, word);
                } else {
                    hashMap.put(name, ++count);
                    Word word = new Word();
                    word.setName(name);
                    word.setCount(1);
                    hashWord.put(count, word);
                }
            }
        }
    }

    public void println() {
        for (int i = 1; i<= count; i++) {
            System.out.println("单词为---" + hashWord.get(i).getName() + "   出现的次数---" + hashWord.get(i).getCount());

        }
    }
}

package com.hao.test;

/**
 * description
 *
 * @author zhanghaohao089
 * @date 2017/8/16
 */

public class Word {
    private String name;
    private int count;

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public int getCount() {
        return count;
    }

    public void setCount(int count) {
        this.count = count;
    }
}

node：
1、先判断…符号再判断.符号

至于为什么要用hashMap来储存，因为hashMap在已知条件的情况下，存取极快，修改快，没有删除操作

数据结构优点缺点
数组插入快查找慢、删除慢、大小固定
有序数组查找快插入慢、删除慢、大小固定
栈后进先出存取其他项很慢
队列先进先出存取其他项很慢
链表插入、删除快查找慢
二叉树查找、插入、删除快算法复杂（删除算法）
红黑树查找、插入、删除快算法复杂
hash表存取极快（已知关键字）、插入快删除慢、不知关键字时存取很慢、对存储空间使用不充分
堆插入快、删除快、对大数据项存取快对其他数据项存取慢
图依据现实世界建模算法有些复杂
AVL树查找、插入、删除快算法复杂