统计一篇文章中单词出现的频率（java 版）

最新推荐文章于 2022-02-12 11:07:18 发布

原创最新推荐文章于 2022-02-12 11:07:18 发布 · 4.8k 阅读

9 ·

CC 4.0 BY-SA版权

文章标签：

#java #hashmap #string #integer #iterator #null

Java 专栏收录该内容

8 篇文章

订阅专栏

该博客介绍了一种使用Java实现的算法，通过HashMap来统计一篇文章中各单词的出现次数。程序读取名为'Test.txt'的文件，利用StringTokenizer分割单词，并存储到HashMap中。最后，通过TreeMap按字母顺序输出所有单词及其计数。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

        统计一篇给定的文章中，各个单词出现的次数的算法。用HashMap 来存放出现的单词的次数，Key 是要统计的单词，Value 是单词出现的次数。
最后再按照 Key 的升序排列出来。

import java.util.*;
import java.io.*;

public class CountOccurrenceOfWords {

    public static void main(String[] args) throws Exception {
        Map hashMap = null;
        BufferedReader infile = null;
        StringTokenizer st = null;
        String filename = "Test.txt";
        String string;
        String file = null;
        //打开一篇文章，名字是 Test.txt .
        infile = new BufferedReader(new FileReader(filename));
        while ((string = infile.readLine()) != null) {
            file += string; //都出整篇文章，存入String中。

        }

        hashMap = new HashMap();

         // 取出文章中的单词，"," "." "!" " " 为各个单词的分界符。
        st = new StringTokenizer(file, " ,.!");

        while (st.hasMoreTokens()) {
            String key = st.nextToken();
            if (hashMap.get(key) != null) {
                int value = ((Integer) hashMap.get(key)).intValue();
                value++;
                hashMap.put(key, new Integer(value));

            } else {
                hashMap.put(key, new Integer(1));
            }
        }

         //按照单词的字母次序输出。
        Map treeMap = new TreeMap(hashMap);
        Set entrySet = treeMap.entrySet();

        Iterator iterator = entrySet.iterator();

        while (iterator.hasNext()) {

            System.out.println(iterator.next());
        }

    }

}