开放官方公报的协作构建
1. 相关工作
开放政府数据倡议通常以数值数据的形式发布,并非像构成官方公报那样的严格文档。虽然文献中有一些探讨官方公报机器可读性问题的研究,但此类研究寥寥无几,且未能从社会技术的整体层面解决该问题。关于如何将政府公报作为开放数据发布的研究也不多。
有一项关于菲律宾开放数据倡议的研究提到,该倡议发布的首批数据是该国政府公报的数字版本,但这些数据的元数据质量受到了批评。还有研究对巴西联邦公报进行语义标注并建立文章间的关联,能确定哪些法案被废止或取代,但仅涉及财政领域。该研究以巴西参议院LexML为基础识别文章文本中的法案,虽有很大帮助,但由于缺乏处理相关人员姓名的明确词汇,很难识别法案上的签名。此外,作者未说明从PDF文件中提取文本时遇到的问题以及该过程对结果的影响,不过提到PDF文本采用多列排版,增加了提取难度。另外一篇文章讨论了通过SPARQL发布智利法律数据,但未明确数据库最初使用的格式。获奖项目“联邦公报2.0”试图将印刷材料转换为机器可读的XML数据,目标是让联邦公报更易搜索、获取、理解和共享,但在科学文献中难以找到该项目的详细信息和实施情况。
2. 方法论
本项目由公共部门与研究人员合作开展,采用了多种方法支持其发展。除了对官方公报及其在互联网上的可用性进行文献回顾以获取相关经验外,还进行了文献和实验研究。
项目采用的方法受行动研究(AR)设计的启发。选择AR是因为它能预测并支持过程干预,这在本研究的合作中有所体现。根据相关理论,强化的AR方法包括建立研究环境阶段,以及以下五个阶段的循环迭代:
1. 诊断 :提出关于组织问题成因的理论。
2. <
超级会员免费看
订阅专栏 解锁全文
687

被折叠的 条评论
为什么被折叠?



