Java过滤掉非UTF-8字符方法

Java过滤掉非UTF-8字符方法

	static public String filterOffUtf8Mb4(String text) throws UnsupportedEncodingException {
		byte[] bytes = text.getBytes("UTF-8");
		ByteBuffer buffer = ByteBuffer.allocate(bytes.length);
		int i = 0;
		while (i < bytes.length) {
			short b = bytes[i];
			if (b > 0) {
				buffer.put(bytes[i++]);
				continue;
			}
			b += 256;
			if ((b ^ 0xC0) >> 4 == 0) {
				buffer.put(bytes, i, 2);
				i += 2;
			}
			else if ((b ^ 0xE0) >> 4 == 0) {
				buffer.put(bytes, i, 3);
				i += 3;
			}
			else if ((b ^ 0xF0) >> 4 == 0) {
				i += 4;
			}
		}
		buffer.flip();
		return new String(buffer.array(), "utf-8");
	}


### Java 中处理 UTF-8 编码问题的解决方案 在 Java 中遇到 `unsupported content encoding utf-8` 的错误通常是因为程序尝试读取或写入的内容未被正确识别为 UTF-8 编码。以下是详细的分析和解决方法: #### 1. 设置 JVM 参数 确保启动应用程序时设置了 `-Dfile.encoding=UTF-8` 参数,这可以强制 JVM 使用 UTF-8 作为默认字符集[^1]。 ```bash java -Dfile.encoding=UTF-8 -jar your-application.jar ``` #### 2. 明确指定文件流编码 当操作文件输入输出流时,应显式设置编码方式为 UTF-8,而不是依赖系统的默认编码。例如,在读取文件时可使用如下代码: ```java import java.io.BufferedReader; import java.io.InputStreamReader; public class Utf8Reader { public static void main(String[] args) throws Exception { try (BufferedReader reader = new BufferedReader(new InputStreamReader(System.in, "UTF-8"))) { String line; while ((line = reader.readLine()) != null) { System.out.println(line); } } } } ``` 上述代码通过 `InputStreamReader` 构造函数指定了 `"UTF-8"` 编码[^3]。 #### 3. 配置 Web 应用中的请求响应编码 如果是在开发基于 Servlet 或 JSP 的 Web 应用,则需配置 HTTP 请求和响应的编码格式。可以在过滤器中统一设置: ```java response.setCharacterEncoding("UTF-8"); request.setCharacterEncoding("UTF-8"); ``` 对于 Spring Boot 用户,可以通过以下方式全局设定编码: ```yaml server: tomcat: uri-encoding: UTF-8 spring: http: encoding: charset: UTF-8 enabled: true force: true ``` #### 4. 数据库连接字符串中的编码参数 数据库交互过程中也可能引发类似的编码异常。以 MySQL 连接为例,应在 JDBC URL 后附加 `useUnicode=true&characterEncoding=UTF-8` 参数来保障数据传输的一致性[^4]。 ```properties jdbc:mysql://localhost:3306/mydb?useUnicode=true&characterEncoding=UTF-8 ``` 以上措施能够有效应对大多数场景下的 UTF-8 支持不足的情况。然而需要注意的是,实际应用环境中很少会频繁涉及字符数量统计等问题,因此除必要,一般无需特别关注此方面功能实现细节。
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值