java实战:递归识别.java文件,复制到同一文件夹。

package com.swift.test;

import java.io.*;

public class toCombine {
	public static void main(String[] args) throws Exception {
		// 定义输出目录
		String FileOut = "D:\\jquery.txt";
		// 读取目录下的每个文件或者文件夹,并读取文件的内容写到目标文字中去
		File[] list = new File("D:\\bbbb").listFiles();
		int fileCount = 0;
		int folderConut = 0;

		BufferedWriter bw = new BufferedWriter(new OutputStreamWriter(new FileOutputStream(FileOut), "GBK"));
		for (File file : list) {
			// 获取文件编码格式
			if (file.isFile()) {
				fileCount++;
				// 通过文件名获取编码类型
				String encodType = codeString(file.getAbsolutePath());
				System.out.println("-----------" + file.getAbsolutePath());
				FileInputStream fis = new FileInputStream(file);
				BufferedReader br = new BufferedReader(new InputStreamReader(fis, encodType));
				System.out.println("-----------" + encodType);

				String line;
				while ((line = br.readLine()) != null) {

					bw.write(line);
					bw.newLine();
				}

				br.close();
			} else {
				folderConut++;
			}
		}
		bw.close();
		System.out.println("输入目录下文件个数为" + fileCount);
		System.out.println("输入目录下文件夹个数为" + folderConut);

	}

	/**
	 * 获得文件编码
	 * 
	 * @param fileName
	 * @return
	 * @throws Exception
	 */
	public static String codeString(String fileName) throws Exception {
		String charset = "GBK";
		byte[] first3Bytes = new byte[3];
		try {
			boolean checked = false;
			BufferedInputStream bis = new BufferedInputStream(new FileInputStream(fileName));
			bis.mark(0); 
			// 读者注: bis.mark(0);修改为 bis.mark(100);我用过这段代码,需要修改上面标出的地方。
			// Wagsn注:不过暂时使用正常,遂不改之
			int read = bis.read(first3Bytes, 0, 3);
			if (read == -1) {
				bis.close();
				return charset; // 文件编码为 ANSI
			} else if (first3Bytes[0] == (byte) 0xFF && first3Bytes[1] == (byte) 0xFE) {
				charset = "UTF-16LE"; // 文件编码为 Unicode
				checked = true;
			} else if (first3Bytes[0] == (byte) 0xFE && first3Bytes[1] == (byte) 0xFF) {
				charset = "UTF-16BE"; // 文件编码为 Unicode big endian
				checked = true;
			} else if (first3Bytes[0] == (byte) 0xEF && first3Bytes[1] == (byte) 0xBB
					&& first3Bytes[2] == (byte) 0xBF) {
				charset = "UTF-8"; // 文件编码为 UTF-8
				checked = true;
			}
			bis.reset();
			if (!checked) {
				while ((read = bis.read()) != -1) {
					if (read >= 0xF0)
						break;
					if (0x80 <= read && read <= 0xBF) // 单独出现BF以下的,也算是GBK
						break;
					if (0xC0 <= read && read <= 0xDF) {
						read = bis.read();
						if (0x80 <= read && read <= 0xBF) // 双字节 (0xC0 - 0xDF)
							// (0x80 - 0xBF),也可能在GB编码内
							continue;
						else
							break;
					} else if (0xE0 <= read && read <= 0xEF) { // 也有可能出错,但是几率较小
						read = bis.read();
						if (0x80 <= read && read <= 0xBF) {
							read = bis.read();
							if (0x80 <= read && read <= 0xBF) {
								charset = "UTF-8";
								break;
							} else
								break;
						} else
							break;
					}
				}
			}
			bis.close();
		} catch (Exception e) {
			e.printStackTrace();
		}
		System.out.println("--文件-> [" + fileName + "] 采用的字符集为: [" + charset + "]");
		return charset;
	}

}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值