国内外数字资源长期保存研究现状与进展

更新时间:2023-09-04 06:28:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

研究进展

RE跚勤撇陋sINLIBRARYSCIENCE25

国内外数字资源长期保存研究现状与进展

黄旭毕强

【摘要】本文首先对数字资源长期保存国际会议(IPRES)以及国外具有代表性的启动项目进行简要介绍,进而分析我国数字资源长期保存的研究现状,通过比较国内外研究现状及进展情况,找出我国与国外的差距,并提出我国数字资源长期保存的几点建议。

【关键词】数字资源长期保存

Abstract:Firstly,thispapergivesasimpleintroductionofInternationalConferenceonPreservationofDigitalObjects(IPRES)andseveralforeignrepresentativestatingprogram,thenanalyzestheresearchstatusofthepreservation

theresearch

China.ofdigitalobjectsinChina.FindingthegapbetweenChinaandtheforeignstatesbycomparingandtheprogresssituation,thengivessomesuggestionsonthepreservationofdigitalobjectsfor

Keywords:digitalresources10ng-termpreservation

1国外数字资源长期保存研究进展

1.1数字资源长期保存国际会议IPRES

自2004年至今,关于数字资源长期保存国际会议(International

所示。

1.2国外启动的数字资源长期保存项目

自20世纪90年代初,数字资源长期保存问题的研究就开始受到关注并给予立项研究,其中具有代表性的项目如下:

1.2.1美国的NDIIPP项目

NDIIPP(NationalDigitalInformationInfrastructurePreservationProgram)项目,即国家数字信息基础设施ConferenceonPreservationofDigitalObjects,简称IPRES)已召开了四届,吸引了越来越多的机构和学者的参与和关注。历届会议的详细情况如表1和保存计划,是以美国国会图书馆为主导,联合全国许多大学图书馆、研究机构、商业组织对数字资源进行收集、保存的研究。它的工作目标是致力于寻找全国对数字资源的保存所需的技术组成、技术标准及重要的政治意义予以关注,通过与各种机构、企业、图书馆、大学合作,发展全国性的数字信息资源收集和保存战略,建立保存工作合作伙伴网络,构建保存工作的体系结构,进行数字信息资源保存研究。作为国家级的数字资源保存项目,NDIIPP包括8个子项目,内容基本包括了当前各类数字载体的信息,如Web信息、视频、音频、数字期刊、电子图书、数字电视等内容,构建了一个数字资源长期保存的国家策略,为其他部门的数字资源长期保存计划提供借鉴和支持。[¨

1.2.2英国的CEDARS项目

CEDARS(CURLExemplarsinDigitalArchives)项目,即高校研究图书馆联盟数字存盘样书项目,是由英国JISC(JointInformationSystemsCommitteeoftheHigherandFurtherEducationFundingCouncils:高等及继续教育基金会联合信息系统委员会)资助建立的,在1998--2002年间进行。其致力于研究数字保存的策略、方法和实际问题,包括数字对象的获取、长期保存、有效描述和永久获取。CEDARS其成果是研究了数字资源长期保存的战略框架和具体方法,并建立了一个分布式的长期存储系统和支持数字资源长期保存的CEDARS元数据。另外,它还参与了RLG(ResearchLibrariesGroup:美国研究图书馆协会)、OCLC(OnlineComputerLibraryCentre

研究进展

26图书馆学研究2009.1

Inc.:联机计算机图书馆中心)及来自其他课题组的代表共同参与的保存元资料工作小组的工作,2001年保存元资料工作小组发表了白皮书。【23

裹1

举办时间2004年7月14—16日

中国北京数字资源长期保存国际会议IPRES相关情况2005年9月15—16日德国哥廷根2006年10月8—10日美国纽约伊萨卡2007年10月11-12日中国北京

中国科学院国家科学图

书馆举办地点主办机构中国国家图书馆哥廷根大学图书馆康奈尔大学

1.数字资源长期保存的

1.数字资源长期保存的

一般问题。

2.不同数字对象的长期

保存技术。1.多媒体对象的保存。

2.电子期刊的保存。

3.国家在数字资源长期

保存方面所做的努力。管理:规划、执行、人员、资金、质量保证。2.数字资源长期保存的会议主题3.数字资源长期保存的组织环境。1.数字保存政策。2.技术工作流。实施:系统的评价和选择、工作流管理和权限管理。3.数字资源长期保存领

域的新动向:服务环境、

网格、个人存档、科学4.数字资源长期保存的全球支撑结构。5.国家和国际长期保存

策略与启动。3.Web存盘。数据和原始出版物之间

的关联。

数字资源保存策略、数

字资源保存技术体系、数字保存基础设施建设;

数字保存工作流程、

数字资源长期保存中的Web存盘、数字保存格

式、长期保存元资料、长期保存系统实践进展;机构知识库;长期保存战略与政策;可信赖知识库及其认证;研究数

据的长期保存;长期保存

项目与系统的管理。数政策、策略,管理、法主要内容律、经济、技术等各种长期保存中的知识技术、长期保存中的信息封装。数字资源长期保存中的问题,介绍了欧洲9个重要的数字资源长期保

存项目和联盟组织。对多媒体对象的保存问题;电子期刊的保存问

题;国家相关政策;认

证机制;电子化和数字

化存取技术。字资源长期保存的战略计划与基础设施、相关管理问题、技术研究与实践、认证与评估、教育与培训。

1-2.3以荷兰为领导的NEDLIB项目

NEDLIB(NetworkedEuropeanDepositLibrary)项目,即网络化欧洲存储图书馆项目,它于1998年1月启动,2001年1月结项。由荷兰国家图书馆牵头,欧洲7个国家图书馆(荷兰、法国、挪威、德国、葡萄牙、瑞士、意大利)以及3个主要出版社KLUWER、ELSEVIER、SPRINGER—VERLAG参与,以合作项目形式研究长期保存基础结构。其目的是研究欧洲存储图书馆机制,以保证电子出版物的长期获取。成果主要有:建立了一种电子出版物长期存储系统模型;研究了实际应用的最佳状态、技术标准以及运作方法;研制了建立存储系统的小型工具包,元数据搜索程序等。[3]

1.2.4德国的NESTOR项目

NESTOR《theNetworkofExpertiseinLong—termStorageofDigitalResources)项目,是由德国教育和研究委员会(GermanFederaIMinistryofEducationandResearch)资助、启动资金80万欧元的数字资源长期保存项

研究进展

RESEARCI-[F_强INLIBRARYSCIENCE27

目,在2003--2006年间进行,由德国国家图书馆负责,与下萨克森州和大学图书馆、柏林洪堡大学计算机和多媒体服务中心及图书馆、慕尼黑巴伐利亚州立图书馆、柏林博物馆信息研究所和巴伐利亚州档案馆共同完成。它的主要目的是:增强并推广数宇资源长期保存意识和理念,引起政府对此问题的重视:建设信息网络平台,收集相关技术、组织、法律和其他方面信息,发布现有调查研究、项目以及实践信息;在存盘机构(图书馆、博物馆、档案馆)、企业、研究机构之间建立本国和国际战略联盟,共同解决数字资源长期保存问题;建设数字资源长期保存发展和协作战略的多学科论坛,完善数字资源长期保存的服务、技术和标准;建立稳定的组织模型,便于合作项目的开展。【43

1.2.5澳大利亚的PANDORA项目

PANDORA(PreservingandAccessingNetworkedDocumentaryResourcesofAustralia)项目,即保护和存取澳大利亚网络信息资源项目。其根本目的是在建立一个经过选择的澳大利亚网络信息资源归档系统的同时,为保护和存取澳大利亚电子资源制定政策和程序。采用选择性存取策略,侧重收集重要的且具有长期保存价值的联机出版物和网站。目前该项目由电子资源部、编目部、期刊部等部门共同管理,以电子部为主。澳大利亚国家图书馆每年大约花费100万澳元来支持该项目,其中还不包括合作伙伴的支出。现有5个专职员工。其数据增长很快,数据规模已经比较庞大,同时收集的各种类型的文档也比较丰富。Is]

由此可见,国外数字信息长期保存方面的研究和应用已经取得了长足的进展,一些国家已经进行了应用性部署,并积累了大量的经验。

2国内数字资源长期保存研究进展

我国数字资源保存问题研究始于20世纪90年代后期,经过近10年的发展,虽取得了一定的成绩,但与国外相比,我国对数字资源长期保存问题的研究仍处于起步阶段,基本上还是以跟踪、吸收、消化国外研究成果为主,自主创新还不够。目前,国内学者对数字资源长期保存问题的理论研究主要集中在对其概念、影响因素、技术策略和管理策略这四个方面。如学者们分别从不同的角度对数字资源长期保存给出定义,并认为其影响因素主要包括媒体因素、技术因素、法律因素和经济因素;数字资源长期保存的策略主要包括技术策略和管理策略这两个方面。除此之外,我国相继启动了国家图书馆的WlCP项目和中国Web信息博物馆项目o

2.1WICP项目

WlCP(WebInformationCollectionandPreservation)项目,即网络信息资源的采集与保存试验项目,它是2003年初由中国国家图书馆启动的涉及网络信息资源保存问题的研究项目。该项目积极探索信息资源的采集与保存的相关法律、技术、标准等问题,在进行网络信息的采集和保存时,对静态网页(表层网页)和动态网页(深层网页)采取不同的策略,形成对应的两个子项目,即网络信息资源采集与保存试验项目(WlCP)和网络数据库导航项目ODBN(OnlineDatabaseNavigation)o

网络信息资源采集与保存试验项目(WlCP)的业务流程主要包括:

(1)收集对象的发现:工作人员上网浏览,利用搜索引擎收集;

(2)对象的调研:联系网站管理员,调查收集对象的各种特征,明确网站所有机构名、网站开通日期、网页更新频率等;

(3)信息版权处理:电子邮件发送版权声明,询问可否下载、下载深度,可否公开、何时公开、公开方式等;(4)收集对象描述、分类:网站名、版权所有者、开通Et期分类、主题等;

(5)收集条件的设置:收集频率、起动时间等;

(6)实施收集:网络机器人开始起动;

(7)数据校验和整合:对收集到的数据进行校验,查找失败的原因进行二次收集;

(8)对象编目:MARC输入数据录入到Aleph500X系统中,DC书目数据录入到试验系统中。

国家图书馆开展保存试验项目的目的是通过试验发现网络文献收集、整理、编目、保存和服务中存在的问题,提出解决问题的方案;确定保存对象,根据其特点确定技术路线和策略;试验性收集、整理、保存数据并提供服务;提出业务整合的方案。它不仅为我国网络信息资源保存实践开辟了新路,也为今后的保存实践提供了宝贵的经验。

2.2Web信息博物馆

中国Web信息博物馆(WebInfomall)是2002年1月,在国家“973”和“985”项目支持下,由北京大学

研究进展

28IE书馆学研究2009.1

“计算机网络与分布式系统实验室”主持开发的中国网页历史信息存储与展示系统,包括历史网页存储系统和回放系统两个部分。目前系统可以收集中国所有静态网页,并提供历史网页的存盘和回放,已经维护有10亿以中文为主的网页,并以平均每月一千万网页的速度扩大规模。它的基本使命是以一种集中的形式,全面展现中国互联网上信息的历史;为社会提供多种海量网络信息产品,供相关科研人员进行研究。【61

3国内外数字资源长期保存研究比较

综上所述,国外在对数字资源长期保存问题的研究上已经取得了显著的进步,我国与之相比主要存在以下几个方面的差距:

3.1从研究主体来看

与国外相比,我国关注数字资源长期保存的机构比较集中,主要是图书馆、信息中心等信息服务机构。而像出版界、软硬件商或者数据库生产商等机构的介入较少,这反映了数字资源长期保存在我国还没有引起广泛关注,包括信息管理专业在内的全社会缺乏对数字资源长期保存的意识。

3.2从研究内容来看

国外数字资源长期保存计划研究内容更多的是由理论探讨转向实践研究,即更多地探讨数字资源长期保存的标准选择、技术应用及建立可以实际运行的数字资源长期保存系统,关注更多的是对具体项目实施内容的研究。而我国偏重理论研究,实践研究比较缺乏,学者们对数字资源的研究主要以对相关项目的简单介绍为主,研究动态综述的比较多,介绍自身情况的较少,较多偏重对国外成果的介绍以及对有关数字资源长期保存的技术策略方面的探讨,总体来说研究内容不平衡。

3.3从已启动项目来看

国外数字资源长期保存启动项目众多,涉及的研究领域广泛,从保存战略规划、保存技术的开发和应用,保存元数据和规范的制定到相关法律环境的建设;从科学数据、人文数据、多媒体信息到政府办公文件的长期保存,都做了大量的研究和实践。各国之间还开展了很多国际性的数字资源长期保存的合作项目,例如以荷兰为领导的NEDLIB项目。而我国数字资源长期保存实践项目成立的时间较晚,启动项目数目较少,领域较窄,项目研究成果较其他国家少,缺乏相关的经验,技术水平与欧美发达国家相比还存在很大的差距。

3.4从政策制定来看

建立关于数字资源长期保存的国家相应政策,有利于在全国范围内有组织、有计划地构建一个国家数字资源长期保存协作网,最全面、最经济、最合法、最有效地实施对国内外重要数字资源的长期保存和利用。目前,欧美等国都在建立适应本国的数字资源长期保存政策来确保数字资源长期保存的顺利开展。在这方面做得比较好的像澳大利亚的PANDORA项目等。而我国从对数字资源长期保存的政策方面来看还没有什么实质上的进展,没有确定出相关的政策法规制度,国家层面上还没有完善的组织保障、政策体系、管理机制、技术支持以及协作配合。建议我国数字资源长期保存工作应着力做到以下几个方面:(1)形成广泛参与的社会行为;(2)将理论联系我国实际;(3)制定数字资源长期保存的国家政策;(4)建立不同层次的合作机制;(5)制定合理的保存策略。注释

1-13[2][3][4][5][6]ParochialLibrariesAct1708.http:flwww.statutelaw.gov.uk/content.aspx?LegType:AIl+Primary&Pag--

eNumber=1&NavFrom=2&parentActiveTextDocld=1516319&ActiveTextDocld=1516319&filesize=15263

黄旭吉林大学管理学院硕士研究生。毕强吉林大学管理学院教授、博士生导师。

本文来源:https://www.bwwdw.com/article/otgi.html

Top