档案信息化从业人员肯定对异构系统数据采集过程中碰到的各种问题深有体会,有源系统供应商不配合的;数据接口不开放的;归档数据不符合规范的;数据敏感不提供的;等等;不一而足。但不幸的是档案信息系统处于政务信息化的后端,必然需要和各种行政办公系统、核心业务系统、数据管理系统进行对接,从这些前端系统中捕获、采集、接收档案数据,实现电子文件归档或者电子档案接收。由于前端系统中的数据来源四面八方、数据类型五花八门、数据格式千姿百态、数据流向千变万化,如何将其中有价值的、待归档的数据完整收集、有效管理、妥善保存、安全利用是各级档案管理部门需要深入思考的问题。这其中,异构档案信息资源的采集工作是所有问题的源头,是当前亟待解决的首要问题。
下图所示为智慧城市框架下城市运营、政府管理、社会治理、市民生活等各个信息系统产生的数据来源。面对汹涌而来的各类数据,作为政务信息资源最终归宿地的档案馆,该如何应对这种局面?
异构档案信息资源的主要来源
我们首先来分析一下异构档案信息资源的主要来源:
随着电子政务建设的不断深入而产生的有关食品安全、公共交通、社会保障、教育卫生、气象环境等民生档案信息资源及各类政务信息资源;
随着互联网、移动互联网技术的发展和普及而产生的各类网站数据、社交媒体数据、电子邮件数据等;
随着电子商务的不断完善和普及而产生的各类订单数据、账单数据、物流数据等;
随着大数据技术的发展和应用而产生的各类报表数据、统计数据、决策数据等。
以上各类异构档案信息资源如果按文件格式进行分类,主要包括文本文件、图像文件、图形文件、音频文件、视频文件、数据库文件、多媒体文件等