目录
3、创建net.hw.wc包,在包里创建WordCount类
一、功能需求
1、针对英语文本文件
2、可以清洗文中英文标点符号
3、不必考虑英文单词变体形式
比如take, took, taken, taking,就处理成不同单词
二、实现思路
1、利用缓冲字符输入流实现文件行读取
2、通过循环读取文本文件所有行
3、对读取的每一行,清除所有英文标点符号
4、对清洗标点符号的每一行按空格拆分,得到单词数组
5、遍历单词数组,统计单词个数,保存到哈希映射对象里
6、按键遍历哈希映射对象,输出每个单词及其个数
三、实现步骤
1、创建Java项目 - Java版词频统计

本文档详细介绍了如何使用Java实现词频统计功能,包括功能需求、实现思路和具体步骤。功能需求涵盖处理英语文本文件,清洗英文标点,不区分单词变体。实现思路涉及读取文件、清除标点、拆分单词、统计词频和输出结果。最后提供了课后作业,要求按键升序和值降序输出词频统计结果。
订阅专栏 解锁全文
878

被折叠的 条评论
为什么被折叠?



