39、文本处理系统综合介绍

文本处理系统综合介绍

在文本处理领域,存在着多种强大的系统和工具,能够满足不同的需求。下面将详细介绍SGML、XML、DocBook、groff和Texinfo等文本处理系统。

1. SGML、XML和DocBook

SGML和XML是比之前讨论的文本标记语言更高级的存在。它们为文本赋予结构,展示了每个元素与其包含元素之间的关系,这使得文本能够转换为多种输出格式,如PostScript和PDF。

SGML本身只是一个定义文档结构的框架,而文档类型描述(DTD)或模式则定义了在文档中允许使用的标记类型。尽管SGML并不广为人知,但它的两个“后代”——HTML和XML却声名远扬,甚至有些被过度炒作。HTML本质上是SGML的一种实现,具有一组固定的标签,用于网页格式化非常有用;XML则和SGML类似,是一种通用解决方案,但去掉了SGML的一些复杂特性。SGML和XML都允许用户定义自己喜欢的标签集,具体的标签及其关系在DTD或模式中指定(XML中的DTD或模式是可选的)。

对于每个想要使用的DTD或模式,需要有相应的处理工具将SGML或XML文件转换为所需的输出格式。过去,大多数免费系统通过DSSSL系统来实现这一转换,现在XSLT在将XML转换为其他格式方面更为流行。不过,除非你想改变输出的外观,否则无需过多关注这些。

在计算机文档领域,最常用的DTD是DocBook。许多免费的Linux文档以及很多知名公司和组织的文档都使用DocBook编写,例如Sun Microsystems、Microsoft、IBM、Hewlett - Packard、Boeing和美国国务院等。

以下是一个计算机杂志文章的DocBook文本片段

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值