减少标记!自然写作应指导文本建模前端的设计
在文本处理领域,标准标记语言如 SMGML 和 XML 为结构化信息的处理带来了便利,但现有标记概念存在一些缺陷。本文介绍的直接文档表示(Direct Document Denotation,DDD)方法旨在解决这些问题,实现更便捷的文本输入前端。
XML 的角色
在建模工具的设计和实现中,XML 有三个重要角色:
1. 作为底层数据交换介质 :对用户而言,XML 是一种编码标准,用于在不同工具和不同位置之间以可迁移的格式交换结构化信息。
2. 作为输入格式 :通过 DTD 或 SCHEMA 配置的屏幕掩码编辑器,领域专家或不太专业的人员可以直接获取和维护 XML 结构化数据。
3. 作为标记语言 :对于较短的文本(如配置文件),可以直接输入 XML 前端语法。
然而,XML 在设计上主要简化了计算机的解析任务,而忽视了人类的写作任务。例如,XML 要求所有结构定义的实例都能在 LL(1) 中解析,这导致了用户友好的文本输入前端的缺失。
DDD 的引入
DDD 试图弥补这一差距,实现 XML 的第四个角色:作为底层结构定义,自动生成方便的文本输入前端。DDD 在以下两种情况下特别有用:
1. 存在半正式文本编码的遗留数据,需要以最小的努力将其提升到精确的计算机可处理格式。
2. 需要从头创建一个针对特定领域问题的文本建模前端,设计人员和开发人员希望专注于语义问题,并免费获得一个输入前端。
与掩码编辑器相比,DDD
超级会员免费看
订阅专栏 解锁全文
1051

被折叠的 条评论
为什么被折叠?



