保护历史,不可流于空谈
都知道“中国是个历史悠久的国家”,这话可不是随便说说而已。在历史上,中华民族对档案的重视,可以说是无人能出其右——如果没有《春秋》、《左传》和以《史记》为代表的二十四史流传至今,我们数千年的文明史将何从谈起呢?
然而,数千年后的我们在对史料的保护上已经远远的落在了历史并不长的美国的后面。举例来说,从1940年的罗斯福开始,已有12位卸任总统建立了图书馆,此外还有由私人经营的林肯图书馆。美国的总统图书馆兼有档案馆的职能,EMC公司两年前就曾和美国国家档案馆合作把肯尼迪总统的全部文件、文档、照片和录音数字化,放到肯尼迪总统图书馆的网站上供全世界的人们访问。
反观我们,在保护老祖宗留下来的遗产时就显得太被动了,端午节、活字印刷术相继被韩国“申遗”,中医、汉字、汉服也正被划归他们的发明。奋起反击也好,不屑一顾也好,咱们已经落了后手。倘若任此局面发展下去,若干年后,2008年奥运会的开幕式导演是韩国人,开幕式的录像SBS电视台保存得比央视还完整,都不无可能啊……
扯远了,咱们还说档案保护。据上个月才从四川档案馆回来的北京远桥科技有限公司经理谭朝松介绍,北川档案馆的硬盘被砸得粉碎,什么都没有了,纸质文件也损失了很多,现在还有一些部分冻在冷库里,已经打湿了,而如果有异地备份的话,这个问题就迎刃而解了,所以四川档案馆正在考虑异地备份的问题。

北京远桥科技有限公司经理谭朝松介绍二史馆的信息化情况
作为EMC在国内档案行业的合作伙伴,远桥科技为图书档案系统提供包括基础平台搭建、数据备份、异地容灾在内的总体解决方案,相关客户有中央档案馆、中国第二历史档案馆、天津市档案馆、江苏省档案馆、×××。其中,中国第二历史档案馆(二史馆)与中央档案馆、中国第一历史档案馆并列为国家级档案馆。二史馆典藏的是中华民国时期(1912-1949)各个中央政权机关及其直属机构档案,对于近代史研究有着非常重要的历史价值。
谭朝松表示,相比金融、电信等行业,档案馆的信息建设相对滞后,从2002年才进入信息时代。2005年二史馆用800万元搭建了包括软硬件在内的总体信息环境。客户在选择的时候,觉得EMC在产品的延续性和完整性上的优势比较突出,能够满足其每年都有很多TB信息增长的需求。另外因为远桥科技与软件供应商(紫光)有很多合作,结合EMC的经验优势,客户很自然地选择了EMC和远桥提供的方案。
二史馆的项目中,存储硬件2005年是EMC的CLARiiON CX300,现在又配上了CX3-20,即将增配的还有EMC的NAS产品,档案访问正在考虑异地容灾,四川地震有可能会推动这一进程。软件方面,可以将纸面文档和传真捕获为电子图像、与工作流程集成并存档的EMC Documentum内容管理平台也是很多档案馆愿意要的产品,这可以使从档案的存储到后端的销毁成为一个很完整的过程。但是Documentum推广的时间比较短,定价一时半会儿尚且不是档案馆级别的客户所能够接受的,尽管谭朝松认为大家会慢慢地倾向于用这种大的平台整合所有的资源。
目前二史馆主要的数据类型是图书档案,接下来要做的是声像方面的。谭朝松认为,图书档案是档案馆做数字化的第一步,第二步才会把声像放上去,而这个数据的增长将是一个“很吓人的数字”。
可是二史馆有没有足够的资金来满足数据增长的需求呢?远桥是EMC极速联盟白金级的合作伙伴,可以在市场推广、行业协会活动和面向最终用户的市场活动上获得EMC的支持以及定制化培训,一些重要的项目还会有专门的售前工程师一起帮助客户解决技术问题,把不同产品的优势发挥到最佳。不过,极速联盟毕竟是专门针对二级渠道的计划,每年能达到5000美元的销售额即可具备最低的第三级“资格会员”资质,第二层的精英级合作伙伴要求每年的销售额超过5万美元,而在“金字塔尖”的第一级——白金级合作伙伴虽然以20万美元为底线,也仍然无法与一级渠道乃至EMC直接覆盖的大型客户相比。
解决资金,先要提高认识
若论对性能的要求,档案行业可能无法与必须处理大量交易密集型数据的金融、电信行业相比,或许也用不上Symmetrix那样的顶级磁盘阵列。但是,如果要让普罗大众都能便捷地访问档案馆保存的各种资料,就必须把大量图书、照片和音视频完全数字化,特别是国家级的档案馆,数据量将是惊人的。如果再用上Centera这样的CAS系统,在存储上的投入规模完全可以与一些金融、电信客户相提并论,仅靠二级渠道的合作伙伴恐怕难以应付。
然而前述情况并没有发生。谭朝松对比了美国、澳大利亚的档案馆在信息化建设上和国内的区别:一个是职能上的不同,美国的档案馆在政府办公体系里拥有的职能远远超过国内的档案馆——譬如现在北京环保比较重要,政府就会倾向投入;另一个是信息化程度,两个国家本身就有质的区别,咱们现在档案馆信息化程度还很浅,大概全国完成完全数字化的档案馆也不过10家,大部分还是10%的数字化。一方面信息存储建设还不够,另一方面也可以看到未来成长空间还很大。
EMC中国区渠道拓展市场总监刘志强也认为,中国的档案行业信息化发展相对落后,意味着有更多的发展空间。譬如国外有很多法规要求,而EMC Centera可以实现对固定内容进行安全保护、高效访问、管理及扩展,所以在国外应用的非常普遍。以后无论是从法规的要求,还是其他角度来看,信息化管理都是档案馆一个非常重要的需求方向。
说来说去,还是绕不出钱从哪儿来的问题。现在国内档案信息化主要的投资来源仍然是当地的政府以及一些宏观上的国家组织,譬如每年有一亿元资金用于全国性的档案抢救,当然地方上也会配相应的资金,个人和组织的捐助则基本看不到。政府投资主要是靠申请的方式,因为每一个单位都在以档案数字化申请项目,包括后端的存储利用。真正有这样需求的档案馆在省级和一些发达城市,国家在法律法规上的保存标准参照30年,各城市根据自己经济状况和需要去做数字化,尚没有硬性要求。
国家每年一个亿的抢救资金,凡是与档案抢救有关的都可以,包括补救损坏的档案,或者是用于扫描和更延续的存储应用,乃至采购存储系统,定义比较广泛。且不论多少,单说这“抢救”二字,便隐含了“不出问题暂缓考虑”的惰性思维,反映出我们对待档案上存在的观念问题还很严重。
想到这里,笔者深有感触。几年前笔者所在的报社要出千期纪念刊,要查以往各期的资料,却只能到库房里去翻阅本应作为“文物”保存起来的旧报纸,而没有更容易检索的电子资料系统可用。是没钱么?该报当时还是正处于巅峰的业内老大;没能力?上世纪九十年代中期,笔者还是该报读者的时候,每半年就会获得随报赠送的电子版CD,要看其中的每一篇文章都很方便。拥有这样的技术,却不能为自己所用,显然是没有予以应有的重视。成天教育大家信息化的IT媒体领头羊尚且如此,档案行业的信息化程度不高也就可以理解了。
观念出了问题,资金也就成了问题。有很多人听说档案馆花几百万买一套存储,便觉得花了很多钱。而在谭朝松看来,这其实是在省钱,因为按照传统方法建一个档案库房,随便投资也要上千万——占地面积不提,恒温、恒湿、防灾各方面都有较高的要求。用信息化存储的方式,现在把这些保存起来很方便,花钱还不多。至于访问控制的问题,非常关键但不难解决。数字化的信息并不是通过服务器让大家随便访问,而是有分级,一种是不涉及国家秘密、开放的,放在网上大家都可以看;另一种是保密的,需要授权,有专门的系统授权用户调取某一个文件。其实大家在实际工作中不难发现,数字化的档案能更多地为政府提供帮助、方便公众的查询。
未来国家可能要搞一个“金馆工程”,对档案馆信息化工作是一个推动。此外还有一些重要的学会、协会从事档案保护,但没有一个强制性机构。笔者以为,除了政府和官方机构,各种民间组织,包括慈善机构,也都可以发挥自己的作用——美国总统图书馆法就规定,前总统的图书馆建设由私人资助,竣工后捐赠给国家档案文件管理署,由该署委派档案工作者、馆长管理。中国的富人在精神层面上的贡献与发达国家比起来仍然相差太远,各种慈善组织把重点放在救助失学儿童等方面固然没有什么错,但是整个社会如果不能给予档案信息化足够的关注,我们的后代有可能沦为精神上的孤儿……
转载于:https://blog.51cto.com/gelada/155375