原代码下载地址
优化的分词系统代码
以下是核心代码
完整代码可以直接运行分词,点我跳转
public class NLPIRTest {
private List<String> files = new ArrayList<>(); //创建数组files
//getAllFiles函数来获得文件的绝对路径
private void getAllFiles(File filePath) {
File[] fsFiles = filePath.listFiles();//获得filepath的绝对路径
assert fsFiles != null;
for (File f : fsFiles) {
if (f.isFile() && !f