HTML标签补偿器

一个简单的HTML标签补偿器,能增补缺失的父元素、自动用结束标签关闭相应的元素,以及不匹配的内嵌元素标签。主要用到了NekoHTML

CODE:
DOMParser parser = new DOMParser();
//下面这段代码缺少了</p></pre>标记
InputStream in = new ByteArrayInputStream(
"<pre><pre>Product Name:lady slipper  </pre><pre>Model Number: 816</pre><pre>Size:36-41#</pre><p>Color: all colors available </p><pre>Place of Origin: China</pre><pre> </pre><pre>Feature:</pre><pre>1)UPPER: pvc</pre><pre>2)OUTSOLE:pvc</pre><pre>3)Suitable age:women</pre><p>Packing:polybag or according to your requests".getBytes());

InputSource source = new InputSource(in);
//解析源
parser.parse(source);
//得到解析完成的DOCUMENT
Document doc = parser.getDocument();
// 获得将DOM文档转化为XML文件的转换器。
TransformerFactory tfactory = TransformerFactory.newInstance();
Transformer transformer = tfactory.newTransformer();
// 将DOM对象转化为DOMSource类对象
DOMSource dsource = new DOMSource(doc);
StringWriter write = new StringWriter();
// 获得一个StreamResult类对象,该对象是DOM文档转化成的其他形式的文档的容器,可以是XML文件,文本文件,HTML文件。这里为一个XML文件
StreamResult result = new StreamResult(write);
// 调用API,将DOM文档转化成XML文件
transformer.transform(dsource, result);
System.out.println(write.getBuffer().toString());

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值