java.nio.charset.IllegalCharsetNameException

9 篇文章 ¥9.90 ¥99.00
当遇到`java.nio.charset.IllegalCharsetNameException`,问题通常源于目标页面的字符集定义不正确,如ISO-8859-1的单引号格式。JSoup在尝试修复页面时会遇到此问题。解决方法包括:1. 不依赖页面的字符集解析,而是直接指定如UTF-8;2. 先获取正确的字符集再进行解析。确保HTML头部的charset声明无误,如正确使用`UTF-8`或`gbk`。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

java.nio.charset.IllegalCharsetNameException: 'ISO-8859-1'

Jsoup.connect("http://www.design.cmu.edu/community.php?s=3").get();

有人可以告诉我为什么代码给了我错误:

java.nio.charset.IllegalCharsetNameException: 'ISO-8859-1'

解答:

问题出在目标页面上。它根本不是格式良好的。

解析页面时,JSoup 尝试修复页面,一方面,将内容类型解析为“text/html; charset='iso-8859-1'”(包括单引号)。

然后它传递这个字符串(带单引号)并使用它来获取字符集:

Charset.forName("'ISO-8859-1'");

这失败了。

问题出在目标页面上。也许您可以改用这种替代方法,它不会解析页面中的字符集,因为您显式地传递了它:

String url = "http://www.design.cmu.edu/community.php?s=3";
Document document = Jsoup.parse(new URL(url).openStream(), "ISO-8859-1", url);

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">  //正确

<meta http-equiv="content-type" content="text/html;charset=utf-8" /> //错误

出现异常:java.nio.charset.IllegalCharsetNameException: utf-8,gbk

所以解析获取的字符集有错,使用它便会出错,可以先获取后解析

上面是第一种方法:

下面是第二种方法,都是先获取后解析

public  String getJson(String httpurl) {
		BufferedReader in = null;
		String result = "";
		try {
			// 发送http请求
			URL url = new URL(httpurl);
			HttpURLConnection httpConn = (HttpURLConnection) url.openConnection();
			httpConn.setRequestProperty("Accept", "*/*");

			// 建立实际的连接
			httpConn.connect();

			// 定义BufferedReader输入流来读取URL的响应,并设置编码方式
			in = new BufferedReader(new InputStreamReader(httpConn.getInputStream(), "UTF-8"));
			String line;
			// 读取返回的内容
			while ((line = in.readLine()) != null) {
				result += line;
			}
		} catch (Exception e) {
			e.printStackTrace();
		} finally {
			try {
				if (in != null) {
					in.close();
				}
			} catch (IOException ex) {
				ex.printStackTrace();
			}
		}
		return result;
	}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值