content是一段json中的HTML文本,不包含html、body等标签; 然在
Document doc = Jsoup.parseBodyFragment(content);
之后,就在每一对双引号的前面一个后面出现了 \"
即使对结果进行处理,替换 "\" " 为 "" 也无用
这是因为json中的content含有转义字符,引号都是 \" ,也就是上面的 \"
需要先进行处理,再转成doc文本
Document doc = Jsoup.parseBodyFragment(content.replace("\\\"","\""));
该博客探讨了在处理包含JSON中的HTML文本时遇到的问题,特别是关于转义字符如何影响Jsoup解析。通过使用字符串替换方法正确处理JSON中的双引号,可以避免解析时出现多余的`"`字符。解决方案是先将JSON内容中的`\`替换为``,然后再进行文档解析。
953

被折叠的 条评论
为什么被折叠?



