Java小程序之获取文本上字符出现的次数并排序

package lastclasstest;

import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.FileReader;
import java.io.FileWriter;
import java.io.IOException;
import java.util.ArrayList;
import java.util.Collections;
import java.util.Comparator;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.Map.Entry;
import java.util.TreeMap;

import org.junit.Test;

/*1.7.1获取文本上字符出现的次数并排序
获取一个文本上每个字符出现的次数并排序,将结果写在times.txt上。

TreeMap
TreeMap 默认排序规则:按照key的字典顺序来排序(升序)
当然,也可以自定义排序规则:要实现Comparator接口。*/
public class Test1 {

    @Test
    public void twst() throws IOException {
        FileReader reader=new FileReader("t.txt");
        FileWriter writer=new FileWriter("times.txt");
        BufferedReader br=new BufferedReader(reader);
        BufferedWriter bw=new BufferedWriter(writer);
        int read=-1;
        Map<Character, Integer> map=new HashMap<>();
        while ((read=br.read())!=-1) {
            char c=(char) read;
            if(map.containsKey(c)==false) {
                map.put(c, 1);
            }
            else {
                map.put(c, map.get(c)+1);
        }
        }
        if(br!=null) {  
            br.close();
        }


        List<Entry<Character, Integer>> list = new ArrayList<Entry<Character, Integer>>(map.entrySet());
        Collections.sort(list, new Comparator<Map.Entry<Character, Integer>>() {
            @Override
            public int compare(Map.Entry<Character, Integer> o1, Map.Entry<Character, Integer> o2) {
                // TODO Auto-generated method stub
                return o1.getValue() > o2.getValue() ? -1 : 1;
            }
        });




        for(Entry<Character, Integer> s:list) {
            writer.write(s.toString());
            bw.newLine();
            bw.flush();

        }if(bw!=null) {
            bw.close();
        }

    }
}
下面是一个Java程序,可以实现统计文本文件中中文字符出现次数按照出现次数排序的功能: ```java import java.io.*; import java.util.*; public class ChineseCharCount { public static void main(String[] args) { String filename = "test.txt"; // 待统计的文件名 Map<Character, Integer> charMap = new HashMap<>(); // 用于存储中文字符和出现次数的映射 try (BufferedReader reader = new BufferedReader(new InputStreamReader(new FileInputStream(filename), "UTF-8"))) { String line; while ((line = reader.readLine()) != null) { for (int i = 0; i < line.length(); i++) { char c = line.charAt(i); if (isChineseChar(c)) { Integer count = charMap.get(c); if (count == null) { charMap.put(c, 1); } else { charMap.put(c, count + 1); } } } } } catch (IOException e) { e.printStackTrace(); } List<Map.Entry<Character, Integer>> charList = new ArrayList<>(charMap.entrySet()); // 将映射转换为列表 charList.sort((e1, e2) -> e2.getValue().compareTo(e1.getValue())); // 按照出现次数从大到小排序 for (Map.Entry<Character, Integer> entry : charList) { System.out.println(entry.getKey() + ": " + entry.getValue()); } } // 判断一个字符是否为中文字符 private static boolean isChineseChar(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c); return ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A || ub == Character.UnicodeBlock.GENERAL_PUNCTUATION || ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS; } } ``` 程序首先读取指定的文本文件,逐行遍历文件中的每个字符,如果一个字符是中文字符,则将其加入到一个映射中,记录其出现次数。最后,将映射转换为列表按照出现次数从大到小排序,输出结果。 程序中使用了`isChineseChar`方法来判断一个字符是否为中文字符,该方法判断的依据是该字符所属的`UnicodeBlock`是否为中文字符所使用的`UnicodeBlock`。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值