电子文档的保存

更新时间:2024-04-01 10:27:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

电子文档的保存

随着计算机技术的飞速发展,信息的网络化日渐成熟,大量的电子文件应运而生。基于电子文件的特点,如何确保电子文件的存储安全, 成为电子档案管理的新课题。

传统的电子文件存储介质有磁带、软磁盘、光盘和硬磁盘等。电子文件的信息形态是数字化的,在生命周期里始终以二进制码的形式存储于载体上,其内容不能直接观看。电子文件产生后,只有在适当的计算机软硬件支持下才可显示内容以及进行其他处理,否则,他就只不过是一些二进制码的集合,及看不见也摸不着。由此可见,电子文件依赖于计算机技术环境的。

另一方面,计算机技术迅猛发展,新技术层出不穷。软硬件技术更新周期通常是2—5年,正在使用的技术在不久的将来就会过时。如果检索、传输或编辑电子文件的软件中任何一项技术过时,都会影响她的读取。尽管数据的丢失与存储载体的变质有很大关系,但主要问题仍是软件与硬件技术的迅速更新、过时。因此,在电子文件的保存管理工作中,采取有效的技术策略就显得很重要。技术策略主要包括技术保存、仿真、迁移与标准化。

一、技术保存

技术保存 ,是指为了延续技术过时的电子文件的可存取性 ,保存处理 电子文件的计算术 ,包括读取电子文件所需的软件和硬件 ,在需要时提供利用。这种方法要求电子文件的各种要设备必须保存齐

全 、良好 ,还必须保持操作这些过时技术的技能。这种方法看上去简单 ,但实际困难不少。首先 ,为了保持系统软硬件正常运转 ,定期检查工作是必需的 ,而且要持之以恒 ,工作量大 其次 ,如果所保存的是非标准化的 、不被广泛使用的设备 ,那么它的适用范围局限于原本使用这些部件的系统 ,因此所需保存的设备门类 、数量繁多 ,导致管理困难再次 ,所保存的硬件设备也会老化 ,并最终无法运转 ,必将导致一些电子文件信息丢失。由此可见 ,技术保存不是可行的长期保存策略 ,不能独立实施 ,在实践中必须联合其它策略使用。

仿真

1.计算机硬件仿真策略。

该策略就是指利用计算机仿真技术在新型计算机的新型操作系统上仿真旧型计算机,然后在仿真的旧型计算机上安装旧型操作系统和旧型应用软件来读取旧格式电子文件信息。例如,使用Microsoft Virtual PC软件,在同一台计算机上安装了DOS、Windows 32/95/97/98/me/2000/xp等多个操作系统及其相应办公软件(例如,UCDOS、WPS For DOS、WPS97/2000WPSOffice2002/2003/2004/2005、Microsoft Office95/95/2000/2002/2003等)和数据库(例如DBASEⅢ、FOXBASE等)软件,基本上解决了基于Microsoft操作系统的过时了的电子文件的利用问题。该策略可以“原汁原味”地再现电子文件的“原生态”,确保电子文件的原始性和真实性。

2.软件仿真策略。

该策略就是指在新型操作系统软件中仿真旧型应用软件,以解决新型应用软件不能读取旧格式电子文件的问题。

信息系统仿真策略可以暂时解决利用旧格式电子文件的问题,适用于所有类型的电子文件。但随着电子计算机软硬件的升级换代,必须不断研发相关的仿真软件。 迁移

迁移是把数字信息从一个硬件、软件配制或平台向另一个硬件、软件配制或平台转移,或是从老的计算机技术向新一代的计算机技术转换。例如 ,把文件从Word98转换到 Word2000 ,这是一个简单的迁移 把文件从Macintosh操作系统转移到操作系统Windows ,也是一种迁移 ,相对复杂一些。

迁移

迁移包括作为保护数字信息的 “更新”手段 ,但在某种意义上是不同于更新的。当硬件与软件发生变更 ,要使用新一代技术维护电子文件的兼容时 ,更新不可能保证产生一个和原文件绝对一致的复制件或精确的数字拷贝 ,而迁移可以保护原电子文件的完整性 、用户对该文件的检索能力 、显示能力与其它利用能力。在不同系统下迁移 ,即使不能保持原电子文件的外观 ,也可以优先维护原电子文件的内容及其功能。在这个前提下 ,迁移在保护数字信息的范围方 面 比更新具有更深、更广的内涵。因而 ,迁移是当前使用最广泛的数字信息保存方法。

但迁移费少足高昂的。即使是用 当前标准格式编码的信息 ,信

息向前迁移到新的标准与应用程序 ,也比简单地进行更新更费时 、开支更大 、操作更复杂。此外 ,虽然大多数电子文件的迁移是成功的 ,有此多媒体文件仍不能通过迁移成功地进行新旧系统的转移。不过 ,迁移目前所遇到的最棘手的问题还不只是技术难题,更多的是非技术性 问题,例如,由谁承担技术转换关键时刻的技术迁移责任与费用等。另外,对于迁移,人们很难预测在什么时候有哪此信息、需要迁移了?所需费用是多少?因此,迁移问题的关键是时机的选择。

标准化

标准化策略 ,要求使用标准格式生成电子文件 ,或把其它格式的电子文件转换成标准格式 ,并形成标准的元数据,标准化有利于实现电子文件在不同系统的互用性 、兼容性 。理论上 ,标准化策略的采用 ,将使得技术更新 、标准变化不再直接影响电子文件的可存取性。无论从成本、可行性角度分析,标准化策略都比上述三种方法优胜

当前不少人主张采用XML作为电子文件的保存格式.XML是Extensible Language (可扩展标记语言)的缩写,是一种中介标示语言(Meta-markup Language) ,可提供描述结构化资料的格式. XML通过简单开放扩展的方式描述结构化的数据。利用Tags标志描述文档的各个元素,通过DTD(Document Type Definition文档类型定义)描述文档的容和结构,Style Sheets(样式表)来描述这些文档如何显示.由于XML具有简单、开放、国际化的特点 ,无论技术发展到怎样的程度 ,计算机都能够处理如此简单的XML文件。这些特点表明XML适合

用作保存电子文件。

二、电子文件信息非电子化保存策略

人们必须通过信息系统(包括硬件和软件)才能利用电子文件信息,这就是电子文件对信息系统的依赖性。我们可以将电子文件信息转移到缩微品或纸上保存,不再使用信息系统(例如,计算机软硬件)读取电子文件信息。这就是电子文件信息非电子化保存策略。该策略可以使文字类、图像类电子文件彻底摆脱对信息系统的依赖,避免因信息系统升级换代而读不出电子文件信息,但这将丢失电子文件中的声音、视频、电子签名/签章等信息。而丢失了电子签名/签章的电子文件会失去其法律依据和凭证作用,从而导致电子文件的“失真”!该策略不适用于声音、视频和电子签名/签章类电子文件。

1、电子文件图像化保存策略

该策略就是指将文字类电子文件格式转换为图像格式永久保存。这就相当于给文字类电子文件拍摄数码照片。绝大多数看图软件都支持JPEG或TIFF格式的图像文件。该策略可以使文字类电子文件摆脱对文字处理/阅读软件的依赖,但这将丢失其中的声音、视频、数字签名、数字签章等信息。而丢失了电子签名/签章的电子文件会“失真”!该策略容易丢失电子文件的非可视信息,不适用于声音、视频和电子签名/签章类电子文件。

2、电子文件通用格式保存策略

所谓电子文件通用格式应当满足以下两个条件:一是通用文件格式应当是开放的标准(即通用文件格式的技术规范要公开,其著作权

不专属于设计该文件格式公司或机构);二是通用电子文件格式为大多数同类软件所支持(即用大多数同类软件都可以打开通用格式的电子文件)。只要今后新编制的同类软件持续支持通用文件格式,通用格式的电子文件就可以永久利用下去。所以在电子文件生成时,应当尽量采用通用文件格式;归档时也应当尽量将电子文件转换为通用格式后再归档。这就是电子文件通用格式保存策略。该策略适用于所有类型的电子文件。

三、电子文件长期保存格式问题的管理措施 1.限定接收进馆的电子文件格式类型

纷繁复杂的格式如果进馆后再进行格式转换,会大大增加管理成本,降低管理效益,因此档案馆必须从源头上加以控制,限定接收的文件格式类型。国家档案馆 2010 年 6 月发布的 《数字档案馆建设指南》 明确规定: “应当选择符合国家标准的格式,暂时未制定标准的,选择开放格式或主流格式。” 2003年1月,英国公共档案馆公布 《电子文件管理、 鉴定和保护指南》明确规定可以接受的文件格式主要有PostScript, TIFF、 , SGML, PDF等。 澳大利亚维多利亚档案馆规定长期保存电子文件的格式为 TEXT、 PDF/A、 PDF、TIFF、 JPEG、 JPEG- 2000、 MPEG- 4 等。我国《电子文件归档与管理规范》 (GB/T 18894—2002)规定文字型的电子文件的通用格式为 XML、 RTF、 TXT;扫描性的电子文件的通用格式为 JPEG、 TIFF;视频、多媒体电子文件的通用格式为MPEG、 AVI;音频电子文件的通用格式为WAV、 MP3。

2.建立格式登记系统(Digital File Format Registries ) 。 电子文件格式登记系统保存了各种常见的文件格式以及创建、运行和迁移这些文件格式的软件的相关技术信息。40YUNNAN ARCHIVES梁娜、 张晓林在 《数字文件格式登记系统》 中介绍了 MIMEMTR、美国哈佛大学牵头建立的全球数字格式注册 GDFR(Global Digital Format Registry ) 、英国国家档案馆数字信息长期保存项目PRONOM 三种格式登记系统。 针对其局限性,有关国家的 IT精英和档案领域的专家建立了一个融合 GDFR与 PRONOM 优点的联合项目:统一数字格式注册系统UDFR(Unified Digital Format Registry),由英国国会图书馆出资支持其技术工作,该项目于 2009 年 4 月正式成立, 2011~2012 年部署使用。建立格式登记系统可以引导文件形成者选择适合文件长期保存的首选格式,并且当文件存在过时的危机时,可以通过系统的查询和自动提醒系统,获知应当转换的格式,并可利用系统提供的转换工具和服务进行直接转换。 3.加强与信息技术等领域的交流与合作

档案部门应当加强与计算机、 信息技术领域的交流与合作,运用先进的技术解决复杂的档案保管和利用问题。美国国家档案与文件署(简称NARA)在这方面做的比较成功,在2007~2017战略规划中 NARA 强调与各联邦政府机构、 国家标准化组织、 美国军方、 国家科学基金会、 研究机构和地方组织等各个机构组织合作,应对电子文件的挑战,以确保在数字时代成功地履行其使命。 档案部门应充分调动积极性和创造性,积极借鉴国内外的有益成果,实行辨证的拿

来主义,为电子文件长期保存创造良好的条件,促进我国档案事业又好又快的发展。

4.加快推进电子文件国家管理战略

针对长期保存电子文件管理方面的诸多难题,各国开始着手实施电子文件国家管理战略。 NARA应对电子文件管理的挑战成立了电子文件档案馆(简称ERA) 。 NARA 以电子文件管理理论研究为先导,进行系统开发以满足电子文件管理的要求。 加拿大图书馆档案馆(Library and ArchivesCanada,简称 LAC )为了实现政府数字资源的长期保存,建立了基于 OAIS 参考模型的可信数字仓储(Trusted Dig-ital Repository,简称 TDR ) 。澳大利亚和新西兰共同提出了澳大拉西亚数字文件保存动议(Australasian DigitalRecordkeeping Initiative,简称 ADRI), ADRI 成员形成了数字文件生成与管理、 保存、 移交和利用等方面的公共标准,如ISO 14721、 ISO 15489 等。我国也应积极将电子文件长期保存纳入国家管理战略中,冯惠玲教授在 2006年提出了 “本着总体规划、 顶层设计、 基础先行、 稳步推进的方针进一步明确我国电子文件管理的国家战略” 的设想。要明确电子文件管理责任制,实施电子文件的全程管理和前端控制,也就是在电子文件整个生命周期的每个处理环节都要明确相应的责任者确保电子文件的特性,电子文件在形成的时候就要考虑到将来长期保存问题。总之,如今信息技术的飞速发展对电子文件的长期保存是一个极大的挑战。作为社会记忆的守护者,档案工作者在应用现有的方法手段管好档案的同时,应加强对电子文

件长期保存格式的研究,既有利于我们对电子文件进行全程管理,也能更好地保障电子文件长期保存的真实性、 完整性、 可读性和安全性。

总之 ,电子文件的保存是一项艰巨作工作,这项工作的关键在于维护数字信息永久的可存取性,涉及到在多变的技术环境中运行数字信息,以及怎样有效地控制这种变化并保持数字信息的长期存取保存数字信息需要众多高新技术的支持,但它绝不仅仅是技术问题 ,还应考虑如何进行科学的管理 电子文件的保存,与法律、经济、文化及技术均息息相关、为保存电子文件,还需多学科、多部门共同研究与协作,形成一个保护电子文件的社会氛与技术环境。

本文来源:https://www.bwwdw.com/article/eijr.html

Top