jsoup html转义,html Jsoup压缩特殊字符_character-encoding_开发99编程知识库

本文探讨了在使用Jsoup解析过程中如何处理特殊字符转义的问题,提出了使用自定义NodeVisitor和字元编码器的方法,强调了在API中添加统一字符生成选项的需求,以保持原始转义顺序。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

除了在 HTTP header 中指定的任何字符集之外,這裡不涉及任何字符集。String check ="

isn’t

".replaceAll("&([^;]+?);","**$1;");

Document doc = Jsoup.parse(check);

doc.outputSettings().prettyPrint(false).escapeMode(EscapeMode.extended);

System.out.println(doc.outerHtml().replaceAll("**([^;]+?);","&$1;"));

輸出

isn’t

討論

我希望在jsoup的API中有一個解決方案- -

使用 jsoup'要求你編寫定製的NodeVisitor 。 它將導致( re ) 發明一些現有的代碼 inside Jsoup 。 定製Nodevisitor將生成一個HTML轉義碼而不是unicode字元。

另一個選項是編寫自定義字元編碼器。 默認的UTF-8 字元編碼器可以編碼 ’ 。 這就是為什麼Jsoup不在最終的HTML代碼中保留原來的轉義順序。

這兩個 上面 選項中的任何一個都代表著一個大的編碼工作。 最終,可以將增強添加到Jsoup中,以便我們選擇如何在最終的HTML代碼中生成字元: 十六進位轉義( AB; ),十進位轉義( ),原始轉義序列( ’ ) 或者寫入編碼字元( 你的文章中的情況是) 。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值