Tidy - 一个把HTML 转成XHTML的工具库[整理]

本文介绍了Tidy——一款用于解析和格式化HTML的开源工具,及其多个衍生项目如JTidy、Ntidy等。Tidy由Dave Raggett设计,通过修正HTML中的错误和松散标签来提高网页质量。此外,文章还提到了NekoHTML和Html2xhtmlCleaner等其他HTML处理工具。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

    Tidy 最初由Dave Raggett设计,并通过W3C 网站以开放源代码许可协议分发。现在Tidy是由SourceForge上的一群志愿者在维护。
Tidy可以用来解析、格式化HTML,是一个出色的HTML解析引擎,它最初设计的目的是用来自动修正HTML中的错误和松散的标签。


Tidy项目可以访问( http://tidy.sourceforge.net/ )获得,目前最新的一次更新是2008年6月份。


下面使一些关于Tidy的一些资料:

1. Tidy最初的设计者Raggett关于它的详细介绍;
( http://www.w3.org/People/Raggett/tidy/ )

2. 技巧: 用 HTML Tidy 将 HTML 转换成XML ;
(   http://www.ibm.com/developerworks/cn/xml/x-tiptidy/#resources )

3. JTidy 是 HTML Tidy用Java实现的移植版本,提供了一个HTML的语法检查器和很好的打印功能,上一次更新的时间是2001年8月
( http://jtidy.sourceforge.net/ )

4. Ntidy是在Tidy基础上的.Net封装,上一次更新的时间是2004年1月
( http://sourceforge.net/projects/ntidy/ )

其它副产品资料:

1. NekoHTML是一个简单地HTML扫描器和标签补偿器(tag balancer) ,使得程序能解析HTML文档并用标准的XML接口来访问其中的信息。上一次更新的时间是2008年12月29日!(注:NekoHTML是java开源项目)
( http://sourceforge.net/projects/nekohtml )

2. Html2xhtmlCleaner能够将HTML转换成合法的XHTML文件,它还提供标签和属性过滤。它是codeproject上的.Net开源项目。
( http://www.codeproject.com/KB/cs/html2xhtmlcleaner.aspx )
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值