java 超链接接受乱码,Java：从URL读取会产生乱码

Java读取网页代码乱码问题解决

最新推荐文章于 2024-07-08 16:07:10 发布

转载最新推荐文章于 2024-07-08 16:07:10 发布 · 196 阅读

文章标签：

#java 超链接接受乱码

博客讲述使用Java读取kickass.to网页代码时出现乱码的问题。代码读取其他网站正常，但该网站返回乱码。原因是服务器配置可能有误，即便客户端未发送Accept - Encoding: gzip头，服务器仍返回gzip压缩响应。解决方案是使用GZIPInputStream进行解压缩。

So I've been trying to read the html code from kickass.to(it works fine on other sites) but all I get is some weird gibberish.

My code:

BufferedReader in = new BufferedReader(

new InputStreamReader(new URL("http://kickass.to/").openStream()));

String s = "";

while ((s=in.readLine())!=null) System.out.println(s);

in.close();

For example:

Does anyone knows why it does that?

thanks!

解决方案

The problem here is a server that is probably not configured correctly, as it returns its response gzip compressed, even if the client does not send an Accept-Encoding: gzip header.

So what you're seeing is the compressed version of the page. To decompress it, pass it through a GZIPInputStream:

BufferedReader in = new BufferedReader(

new InputStreamReader(

new GZIPInputStream(new URL("http://kickass.to/").openStream())));

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

?? 1

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

javaweb乱码

09-08

JavaWeb中的乱码问题主要涉及字符编码的转换和匹配，特别是在处理中文字符时。这个问题通常出现在数据的输入、传输和显示等环节。以下是对javaweb中文乱码问题的详细解析和解决方案： **乱码原理：** 1. **请求...

Java 将PDF格式文件转为txt文件用到的包

10-06

- PDF文件可能包含图像、表格、超链接等复杂元素，这些元素在转换为纯文本时可能会丢失或者难以正确解析。因此，处理这类文件时需要额外的逻辑，例如识别并处理图像内的文字或表格结构。 - PDFBox和iText都提供了...

参与评论您还未登录，请先登录后发表或查看评论

java urldecode 乱码_java URL乱码解决

weixin_32656511的博客

02-13

1131

平常我们都是encode一次,然后直接接受参数Stringpara=request.getParameter(paramName);这是因为容器自动能帮我们解码(DECODE)一般来说,encode的时候,使用的UTF-8(系统的编码) 那么解码的时候也是使用UTF-8的话,那么不会出现传说中的乱码~但是如果在JSP页面使用的UTF-8,但是容器解码的...

解决java用url中读取html源码时的乱码问题

weixin_30768175的博客

09-18

224

1、主要应用getContentType获取相应的网页编码方式： pageUrl=new URL(urlString); HttpURLConnection uc = (HttpURLConnection) pageUrl.openConnection(); String encoding=uc.getContentType(); 2、再提取charset子串（这里使用"charset="...

URL 获取网页内容乱码解决

噶台牛仔

09-02

482

[code="java"] in = url.openStream(); int all = url.openConnection().getContentLength(); byte[] b = new byte[all]; int index = 0; int count = in.read(b, index, all); while...

怪啊！Stream方式读取字符文件出现许多乱码？

jackzhouyu的专栏

07-10

2072

Stream读取字符文件之乱码问题简介如题，开发中我们经常使用InputStream方式来读取一些文件，如字符文件，也许你会这样做： public static BankArea getStringFromFile(Context context){ InputStream stream = null; try { 打开字符文件data.json stream = context.getAssets().open("data.json"); St

BufferedReader reader = new BufferedReader(new InputStreamReader(new FileInputStream(filePath), “UTF

最新发布

qq_33192454的博客

07-08

1411

*使用第三方库：**Java 中的一些第三方库（如 Apache Commons IO）提供了更方便的文件读取方法，并且可以自动处理不同编码格式的文件。**使用正确的编码格式转换工具：**如果您确定文件的编码格式与您指定的编码格式不匹配，您可以尝试使用专门的编码格式转换工具将文件转换为正确的编码格式。如果您希望读取整行内容，包括行末尾的空格，您可以尝试使用。如果您不确定文件的编码格式，您可以尝试使用其他常见的编码格式，如 GBK 或者 ISO-8859-1，并检查哪种编码格式可以正确读取文件。

Java使用iText生成带图片和超链接的Word文档

接下来分析描述内容：“由于工作需要，小研究了下itext，在此和大家分享下……功能：java生成word，支持中文，可以插入图片，可以添加超链接连到其他网址。” 这段话明确指出了项目的四大核心功能：1）使用Java语言...

Java Doc转PDF工具：代码执行与时间计算

在IT行业中，处理文档转换任务是一个常见的需求，尤其是在进行Java编程时，经常需要将文档从一种格式转换为另一种格式，例如从Java文档（通常为Javadoc）格式转换为便携式文档格式（PDF）。这种转换不仅涉及到文档...

Java实现互联网快捷方式URL到HTML文件的转换与问题探讨

在开发过程中，开发者可能会遇到的问题包括文件读取的错误处理（例如权限问题或文件不存在），数据解析的准确性，以及如何优雅地将这些数据格式化为HTML字符串。此外，由于Java支持多种IO操作模式，如顺序读写、随机...

java抓取网页数据乱码_java抓取网页保存的乱码问题解决

weixin_30583711的博客

02-13

551

昨天用java抓取html文件，获取下来的html文件打开总是带有乱码，弄了半天搞定了。其实要避免乱码的一个好方法：没有必要去判断页面的编码方式，只要读取的数据按字节(而不是按字符)保存起来就可以了，后缀为html文件，然后用浏览器打开，肯定是正常的。分析的原因：在网络上传送的数据是基于字节流的，我们要在屏幕上显示的时候要将字节流按某种字符集解码成String的形式，在java中就是将字节流按某种...

java-无法以正确的编码从url读取js文件

weixin_44109689的博客

11-09

354

我想从URL https://d3c3cq33003psk.cloudfront.net/opentag-67008-473432.js中以字符串形式读取js文件我尝试了几种方法(从url读取或下载然后读取),但是我一直都收到不可读的字符,例如“( _.s d ：`. … 我尝试的方式： 1.从网址下载文件： FileUtils.copyURLToFile(jsUrl, fil...

解决URL中有中文的问题，可以放心使用url.opnestream方法

To哥的博客

12-16

4849

解决URL中有中文的问题，可以放心使用url.opnestream方法

JAVA运用URL类 openStream 一个路径中，文件名为中文的问题

落花如雪

03-02

3774

url 中可能带有中文、空格或者单引号等字符，需要进行重编码，解决办法如下：publich void test(){ url = encodeURLChinese(url); } /** * 获取按要求编码后的URL列表 * * @param url * @return */ public static String encodeURL

Java 中BufferedReader & InputStreamReader 系列用法

sinat_33749961的博客

02-27

7677

BufferedReader 类 BufferedReader 由Reader类扩展而来，提供通用的缓冲方式文本读取，而且提供了很实用的readLine，读取一个文本行，从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。一般用法： BufferedReader br = new BufferedReader(new InputStreamReader(

java网页内容,java-读取网页内容

weixin_33155857的博客

03-09

120

你好我想使用Java阅读包含德语字符的网页的内容,不幸的是,德语字符显示为奇怪的字符.任何帮助请这是我的代码：String link = "some german link";URL url = new URL(link);BufferedReader in = new BufferedReader(new InputStreamReader(url.openStream()));String i...