基于本体的CSSCI学术资源网络模型构建及其应用研究
更新时间:2023-05-26 13:58:01 阅读量: 实用文档 文档下载
情报学报 图书情报工作 分析模型
!""#$%%%&%$’(
第)*卷第)期’’$&’+$,)%$%年+月
情报学报
,-./#01-234564!#0"-6!5372-/"6!5#3!2!6
0#83564#!601!#2-/903!-#!""#$%%%&%$’(:;<=)*#;=),’’$&’+$0>?@<)%$%
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Q;@:$%=’KK)RS=@MMI=$%%%C%$’(=)%$%=%)=%$*
基于本体的!""!#学术资源网络模型构建及其应用研究$)
王
昊
苏新宁
(南京大学信息管理系,南京)$%%*’)
摘要
具有语义描述能力的知识组织方式本体机制的提出和发展,为改善6""6!信息服务提供了新的契机。
本文在分析6""6!数据和服务现状的基础上,提出了基于本体构建6""6!学术资源网络模型的解决方案,即通过本体的面向对象的知识结构来组织6""6!中的学术资源,以达到提高6""6!信息服务质量的目的。在完整地阐述提出了专门用于6""6!&-IT;的6""6!本体概念模型的建立和基于概念模型的6""6!数据语义标注过程的基础上,
评价模型,认为可以从正确性、合理性、有效性三个方面分阶段实现本体评价。最后通过具体的实践应用(包括建立基于6""6!&-IT;的知识检索服务平台和实现基于本体的引文分析)验证了该解决方案具有可行性和有效性。
关键词
本体知识组织学术资源网络模型概念模型语义标注知识检索引文分析
$%&%’()*+,!+,&-(.)-/+,’,01223/)’-/+,&+4-*%!""!#1)’0%5/)
$%&+.()%&6%-7+(8&9+0%3:’&%0+,;,-+3+<=
UEIJ4E;EIQ"VO@II@IJ
(!"#$%&’()$"*’"’+,&,"(-,.’%(&,"($#/’"0)"+1")2,%3)(4,/’"0)"+)$%%*’)
1>&-(’)-
!T@MTHW;IT;<;JFGH@NHHEMTHWEX@<@TFY;?QWMN?@X@IJMWDEIT@NMEMED;QW;YZI;G<WQJW;?JEI@[ET@;IHEMXWWI
@IT?;QVNWQEIQQW\W<;>WQ,GH@NH;YYW?MEJ;;QEIQIWGNHEINWY;?@D>?;\@IJ6""6!@IY;?DET@;IMW?\@NWM=-ITHWXEM@M;YEIE<F[@IJ>?WMWITM@TVET@;I;Y6""6!QETEEIQMW?\@NWM,THWM;<VT@;I;IN;IMT?VNT@IJTHW6""6!ENEQWD@N?WM;V?NWMIWTG;?ZMD;QW<XEMWQ;I;IT;<;JF@M>VTY;?GE?Q,GH@NH;?JEI@[WMTHW6""6!ENEQWD@N?WM;V?NWMG@TH;XSWNTC;?@WITWQZI;G<WQJWMT?VNTV?W;Y;IT;<;JF@I;?QW?T;@D>?;\W]VE<@TF;Y6""6!@IY;?DET@;IMW?\@NWM=U@THWIT@?W<FQ@MNVMM@IJTHW>?;NWMM;Y6""6!;IT;<;JFN;INW>TVE<@[ET@;IN;IMT?VNT@;IEIQ6""6!QETEMWDEIT@N@IQW^@IJXEMWQN;INW>TVE<@[ET@;I,>VTT@IJY;?GE?QTHWW\E<VET@;ID;QW<M>WN@E<<FY;?6""6!&-IT;GH@NHTH@IZMTHET;IT;<;JFN;V<QXWW\E<VETWQXFMTEJWMY?;DTH?WWEM>WNTM;YN;??WNTIWMM,?ET@;IE<@TFEIQWYYWNT@\WIWMM=0T<EMT,>?ENT@NE<E>><@NET@;IM@IN<VQ@IJWMTEX<@MH@IJTHWZI;G<WQJW?WT?@W\E<MW?\@NWM><ETY;?DXEMWQ;I6""6!&-IT;EIQ?WE<@[@IJN@TET@;IEIE<FM@MXEMWQ;I;IT;<;JFE?WQW\W<;>WQ,GH@NH\W?@YFTHWYWEM@X@<@TFEIQWYYWNT@\WIWMM;YTHWM;<VT@;I=
?%=7+(0&;IT;<;JF,ZI;G<WQJW;?JEI@[ET@;I,ENEQWD@N?WM;V?NWIWTG;?ZMD;QW<,N;INW>TVE<@[ET@;I,MWDEIT@N@IQW^@IJ,
ZI;G<WQJW?WT?@W\E<,N@TET@;IEIE<FM@M
收稿日期:)%%A年$$月B日
作者简介:王昊,男,博士,讲师,主要从事信息智能处理与检索、本体学习技术及应用、学科评价和引文分析等$*A$年生,方面的研究。5CDE@<:男,教授,博士生导师,主要从事信息智能处理与检索、基FGHE;GEIJA$%K$%LM@IE=N;D。苏新宁,$*((年生,于信息技术的情报分析与评价等方面的研究。
“江苏省研究生培养创新工程C科技创新计划”人文社科项目“基于本体的学术资源网络模型研究”(项目编号:$)本文系
研究成果之一,并得到南京大学人才引进科研启动基金的资助。6O%KPC)()?)
—’’$—
情报学报 图书情报工作 分析模型
情报学报第<>卷第<期<=!=年?月
的有效组织从本质上改变7,,79原有的数据组织结
!引言
(以下构,建立基于本体的7,,79学术资源网络模型简称7,,79E2(.3),将7,,79中所有学术资源联系在一起,形成一个巨大的学术资源网络,像地图一样引导用户获得任何所需的知识,包括本体库中现存的显性知识和可以经过逻辑推理获得的隐形知识,以新的语义检索服务和引文分析模式代替原有的服务模式,解决用户需要更完善的知识服务和现有7,,79提供学术资源服务相对落后之间的矛盾。
随着信息爆炸时代的到来,互联网创始人"#$
[!]
(,&$-(.#/0&1)的概念,%&’(&’)*+&&提出了语义网
用以解决当前互联网缺乏语义理解这一问题。本体(2(.34356)作为一种有效的知识组织方式,被纳入语义网体系,用于在网络资源上融入计算机可以理解的信息,达到资源的语义理解。本体是解决语义层次上网络信息共享和交换的基础。
中国社会科学引文索引(78#(&)&,3/#-4,/#&(/&7#.-.#3(9(:&;,7,,79)
自<=世纪>=年代末诞生以来,以其规范、权威的检索和分析服务得到了使用者的一致认同。然而7,,79信息检索服务的简单化
和直线型的知识组织方式,使得用户在检索时很难获得准确、全面的查询结果。此外,要求更加精确、并能发现隐含知识的引文分析方法,也对传统的基于数理统计的7,,79引文分析服务提出了更高的要求。而数据挖掘技术作为一种信息处理手段,只能在现有资源结构的基础上实现专深方向的剖析,不具有对学术资源间关联进行语义表达的能力,因此无法提供个性化、专业化的用户服务。
7,,79从全国?===多种期刊中精选出?==@A==种人文社会科学精品期刊作为来源期刊,收录所刊载的论文及其相关的关键词、作者、机构、期刊、学科、被引文献等学术资源。其来源数据以关系数据库的形式存储,包括来源文献表、来源文献作者表、被引文献表、期刊载文表、来源刊表以及字典表B个关系,具有庞大的数据量和丰富的实例知识。笔者收集了7,,79<===@<==B年共C年的实例数据,包括近AB万关键词、A=余万篇来源文献、!B=余万篇被引文献,涉及近D!万名作者。现有的7,,79数据结构仅从来源文献和被引文献两个角度展示相关学术知识,而对于其他重要学术资源如作者、主题、期刊、学科、机构等知识的揭示力度不够,无法满足用户快速、准确获取知识,了解学术资源之间共现关联的需要。
7,,79各种资源间纷繁复杂的语义关联,如合作作者、相似文献、学科引用、同被引期刊、关联学科等,对于丰富检索方式、改变引文分析模式具有重大作用,有必要对其进行充分揭示和描述。于是,本文提出了用具有知识语义描述能力的本体机制来提升7,,79学术资源服务的方案,
试图借助本体对知识—DD<—
<
7,,79本体的系统建模
!"#
$%%$&’()*+的特点
根据7,,79E2(.3构建的目的以及现有数据基
础,总结其特点如下:
(!)7,,79E2(.3的目标。7,,79E2(.3的目标不仅包括对学术概念的知识组织,即本体概念模型的建立(包括构建抽象概念层次关系和定义类属性),更重要的是进行知识描述,即基于本体概念模型的
语义标注(,&$-(.#/F((3.-.#3()[<,D]
,展现7,,79中各种学术资源实例之间错综复杂甚至隐含的关系。
(<)7,,79E2(.3的目的。7,,79E2(.3的目的是为了更好地提供知识检索服务和引文分析服务,因此,除了将现有关系数据库结构转化为面向对象的本体结构外,还需要充分挖掘实例之间的语义关联,并计算一定的量化值作为引文分析的基础,如作者间的关联度等。
(D)7,,79E2(.3来源数据结构特点。7,,79E2(.3构建的基础是关系型数据库,
这与目前构建领域本体多以词典或叙词表为基础有所不同。
(?)7,,79E2(.3来源数据内容特点。7,,79每年收录的来源文献以万计,引用文献则以数十万计,实例数量巨大。相对于实例而言,7,,79中的概念,如作者、文献等数量少,概念间层次关系相对明确。巨大的实例数量导致实例间存在着大量的隐含语义关系,值得领域专家去挖掘和探讨。可获得的实例知识成为本体构建的重点。!"!
$%%$&’()*+的构建模型和实施过程
基于7,,79来源数据的特点以及学术资源本体构建的目标,本文建立了如图!所示的7,,79E2(.3构建模型。本体构建的具体实施过程分为B个步骤。
(基于关键词匹配的检索方式)(类)
情报学报 图书情报工作 分析模型
基于本体的"##"$学术资源网络模型构建及其应用研究
图!"##"$学术资源本体构建模型
(!)概念层次结构的建立。分析"##"$元数据,从中获得各种具有考察价值的学术概念。按照一定的分类依据,基于无二义性、互不交叉、覆盖整个抽取领域内核心概念。对核心"##"$领域的原则,概念进行扩展,获得主要和辅助概念,建立概念层次结构。
定义概念属性。属性用于表示概念间的语(%)
义联系。属性定义实际上就是关联概念的探测过程,同时也决定了实例间存在的关系,因此可通过考察实例间存在的现实关系来归纳概念间的抽象关系,并以属性或约束的形式将关系规范化。概念属性定义和概念层次结构建立的完成标志了"##"$&’()*概念模型的实现。
(+)概念实例化。根据概念模型中定义的概念层次结构和属性集合,从经过预处理的"##"$原始数据中获得实例,并在算法库的支持下,为每个实例设置属性值。
[,]
(,)本体存储和展示。使用-.*)/0/等本体开发工具系统规划"##"$&’()*的概念模型,并采用
“瀑布”开发"##"$&’()*的=个步骤不是采用模式,而是采用“循环式增量迭代”模式,即在下一个步骤开始之后如果发现问题,及时返回到上一步骤中进行适当修改,整个过程迭代(*><.?8@)前进;而且整个过程“循环往复”,即通过领域专家和用户的评价和实践应用发现问题,继而进行本体的再开发。
+"##"$本体概念模型的构建
本体概念模型的构建也称为领域知识组织,包括概念的确立、概念层次结构的建立以及基于属性的概念间关系的设置等。领域的知识组织为知识描述准备了必要的知识框架和模型作为指导和参考,其准确性和合理性在很大程度上决定了本体构建的有效性。%&!
"##"$’()*+的概念抽取
"##"$&’()*的概念模型来自"##"$原始数据结构(关系模型)的转化,而具体的实例及其关联则来自来源数据的内容(关系元组),这是"##"$&’()*构建的基本思路。因此可以遵循指定的构建方法,从"##"$元数据结构中提取本体的主要学术概念。
目前建立领域本体概念模型的方法主要有,[A]种:(6*@BC*D()方法。即先鉴别出领!自顶向下域中所有综合抽象概念,然后逐步细化为具体概念。(E*))*FBG@)方法。即先确定领域中的所"自底向上有具体概念,然后通过二义性处理和归纳、聚类等处理,泛化(7<(<.8?45<)形成综合性的抽象概念。#混合(HI9.4J)方法。即先定义顶层的综合性抽象概念和底层的特殊性具体概念,然后分别细化和泛化,逐渐关联到同一中间层概念。$由里而外($(K4J<B’;))或核心扩展(L4JJ?<B’;))方法。这是一种结合!和
—+++—
其层次结构可以使用’12345、’12描述,67345689
等图形化插件展示。对于实例库,可采用自动生成’12文件或关系型数据库等形式进行描述和存储,使用列表或图形方式展示实例间的关系。
(:)本体评价。在一般情况下,可以对照本体评
[:]
等,由领域专家价准则,如7.;9<.提出的五大准则
和本体工程师共同实现本体评价。对于"##"$&笔者认为可以通过用户和领域专家从评价准’()*,
[=]
则和实践应用两个方面来发现问题,完善本体。
(=)本体应用。本文从基于本体的知识检索服务和引文分析服务,包括服务提供的方式、能够实现的功能以及结果可视化等方面,来探讨"##"$&’()*的具体应用。
情报学报 图书情报工作 分析模型
情报学报第47卷第4期48*8年6月
但起点是中间层概念。即首先!的混合扩展策略,
确定领域中的核心概念,然后扩展出其他同层、上层和下层概念。具体采用何种方法主要依赖于领域知识自身的特点(数据环境)以及本体开发人员对领域知识结构的理解。
在!""!#$%&’(构建中,没有现成可利用的上层本体。现有资源以关系型数据库的形式存在,具有明确的元数据结构,主要概念作为关系的主关键词或外部关键词。根据领域数据的这一特点,笔者认为可采用核心扩展的方法来构建概念模型。考察在领域专家的帮助下,经过慎重的!""!#关系模型,识别、分析和统计,确定主题、文献、期刊、学科、作者、单位、时间)个概念作为!""!#学术资源领域的主要概念,将其中主题定为核心概念。主要概念是其本身具有重要的实际!""!#$%&’(中的描述重点,
应用意义,领域中的其他知识都是用于描述这些概念的。主要概念具有无二义性、互不相交的特点,结合辅助概念如基金、项目等,能够覆盖整个!""!#领域的专业知识。*+!
"##"$%&’()概念层次结构的建立
明确了主要概念之后,即可对!""!#$%&’(雏形进行扩展,其方向主要有两个。
同级扩展*)
从!""!#中抽取辅助概念,完成对整个领域的知识覆盖。对来源数据进行分析、总结和抽取,结合本体开发目的,可以获得地区、基金、项目、类型、被引出版社+个辅助概念。辅助概念一方面可以作为提供知识检索服务的辅助元素,例如检索某年度国家社科基金发表的所有论文等;另一方面,也是引文分析的重要对象,如统计某地区各年度的发文引文情况,可以分析出该地区学术活动的发展变化等。
关于!""!#$%&’(概念层次结构中概念关系的
选择和组织问题,可以采用两种方案:"使用部分,整体关系(-./’,(0)组织概念层次结构,即认为层次结构中的下位类是上位类的部分。这是一种面向结构的知识组织方式。!使用子,父类关系(12&3,(0)组织概念层次结构,即认为层次结构中下位类是上位类的子类。这是一种面向对象的知识组织方式。本文选择了第二种方案,理由是:"面向对象的知识组织方式以其封装性、继承性等特点更符合人们的思维方式,而且其稳定性和可扩展性已经在软件工程领域得到了实践的检验。!概念继承思想避免了冗余类的产生。例如在来源文献和引用文献类中,都存在年份类,两者之间不存在明显的对象差异(属性一致),同时将主要概念和辅助概念作为层次结构的最顶层概念。
向下扩展4)
根据定义好的抽象父类,逐步细化说明其下位类。概念细化实际上是一个分类过程,不同类型概念可以根据具体的数据情况(从来源和引用两个角度细化)、实际应用的需要(如根据颗粒度的不同,可将来源期刊细分为种刊和单刊,分别探讨种刊和单刊相互之间的关联;从单位中派生出机构和部门等)以及层次结构可扩展的需要等进行细化。
在概念层次结构的构建过程中,需要把握两个方面的问题:"顶层概念的领域覆盖性和无二义性,防止“知识孤岛”和多重继承现象的出现;!概念层次结构可用性和精确性之间的平衡。领域本体的目的是完整清晰地描述领域知识框架,达到知识重用和共享。然而,过于详尽的层次结构往往带来不可理解性,而且完整的程度也并不像想象中容易把握。笔者认为,对于实际应用而言,概念层次结构应该尽可能简明,易于本体工程师理解,便于概念属性定本文义。基于!""!#学术概念的抽取和核心扩展,建立了!""!#$%&’(的5层概念层次结构。图4显
图!
—556—
"##"$%&’()的!层概念层次结构
情报学报 图书情报工作 分析模型
基于本体的"##"$学术资源网络模型构建及其应用研究
示了其中的!层结构。!"!
#$$#%&’()*概念属性的设置
如果说概念层次结构是本体骨架,那么其血肉就是以属性形式存在的概念间关系(或约束)。"##"$%&’()中的概念属性大致分为两类:(*)数值属性(+,(,(-./01)./1(-)。用于描述概念自身状态和结构等信息,如主题名称、文献编号等。
概念层次结构的确定和概念属性的设置标志着"##"$%&’()知识框架定义的完成。
F基于"##"$%&’()概念模型
的语义标引
即可用于指"##"$%&’()概念模型构建完成后,
导原始数据的语义标注。"##"$%&’()语义标注过程,就是根据概念模型定义的知识框架在原始数据(!)对象属性(&23/4(01)./1(-)。以某一概念的对象作为属性值,用于描述对象(实例)之间的关系,其取值随着对象间关系的变化或环境状态的影响而发生改变。例如主题概念中的“来源文献”属性就是一个典型的对象属性,揭示了主题与来源文献概念之间的语义关联。对象属性根据属性值来源又可以分为:!同类对象属性。如主题概念中的交叉主题属性等,用以描述同类概念间的关联。学科地图、知识地图等的绘制,都是对同类概念间关联的语义描
述。56(1)7,[8]在从关系型数据库中进行本体学习的研究中,也提出可通过对关系数据库元组(同类对
象)的分析,得到概念间的“继承”关系。"异类对象属性。以其他类型对象作为值的属性,例如主题概念中的来源种刊、学科、来源作者等属性就是分别以期刊对象、学科对象和作者对象等作为属性值,揭示的是主题对象和期刊、学科、作者等的相互关系。
如果把处于核心地位的概念称为主体,作为属性的概念称为客体,主客体之间可以通过属性建立关系。这种关系有时是二元的,可以通过三元组9主体,属性,客体:描述。例如9主题,下位主题,主题:就是通过三元组描述了主题与主题之间的下位关联。然而这种属性关系在更多的时候是多元(;<,1-)
的。例如主题概念的“交叉主题”属性,其属性值不仅需要指出具体的客体,还需要说明主客体的关联度。客体和主客体关联度一起构成了属性值。此时就需要使用多元组来描述主客体关系:〈主体,属性,客体,主客体关联度〉(如〈语义网,交叉主题,=+>,?@*!ABC〉
等)。这类属性也称为复合属性。在使用&DE进行描述时,需要引入属性对象进行;<
,1-关系分解[A]。
根据"##"$原始数据描述的概念性质,并结合
"##"$%&’()的实际应用的需要,
在领域专家的参与下,可以分别定义概念层次结构中所有类的属性,并对属性性质,如取值范围、允许取值以及属性的基数等信息进行说明,以实现对概念和关系的明确定义。
中抽取实例,并为实例的属性设置具体值的过程。鉴于"##"$来源数据以及本体概念模型的特点,本文采用信息抽取的方法自动、批量地从数据库中获取实例,并针对不同类型的属性采用不同的计算方式获取属性值,实现"##"$%&’()的语义标注。+",
#$$#%&’()*概念属性值的获取方式
考察"##"$%&’()中概念的所有属性,发现可采用G种方式来完成各类属性的取值。
(*)基于关系模型直接抽取。某些属性直接来自关系的字段名,包括所有数值属性和部分的异类对象属性。针对这类属性,可以直接从关系元组中抽取实例之间的依赖关系(字段值)作为实例的属性值。如来源文献的“所属学科”“、所属期刊”等属性。(!)基于直接统计并适当辅以H><$+>算法。对
于部分异类对象属性需要统计属性实例相对于中心概念实例的关联次数,如来源作者概念的“年份发文量”等。为了使关联属性值更具意义,有时甚至需要基于统计值计算各年总值或实例间关联度。如主题概念的“来源作者”属性,除了统计主题与来源作者之间的关联次数外,还可以基于H><$+>算法计算主题与来源作者的关联度,以便更合理地揭示主题与来源作者的关系。
(G)基于标准加权方法。在讨论同类型概念间关系时,从不同角度出发可以获得概念间的不同关联,例如作者概念之间可能存在共现主题、合作、应用、同被引以及同部门等多种关联。可以对各种关系设置不同权重,进而计算同类概念实例的综合关联度。+"-基于标准加权的语义关联解析
对于"##"$%&’()中的主要概念,同类型概念的不同实例之间均存在一定的内容或其他形式的关联,例如“交叉主题”、“相似文献”、“关联期刊”、“关
—GGC—
情报学报 图书情报工作 分析模型
情报学报第#2卷第#期#%!%年+月
联作者”等。而且各关联实例对中心实例的关联程度也存在差异,有必要对这种同类概念间的内在关联进行深刻揭示。
本文采用标准加权的方法来解析同类实例之间的交叉语义关联。基本思想是:同类实例之间由于不同的关联依据可能存在多种类型的语义关联,因此可以先基于多种标准分别获得实例间关联,再根据不同标准权重各异(对综合关联的贡献程度不同),计算加权平均值,作为实例间的综合关联度。本文仅以来源作者间综合关联度计算为例,说明基于标准加权算法实现同类实例间语义关联解析的方法和过程。
设置同类概念实例间关联的依据标准。考(!)
察来源数据,结合领域专家意见,笔者认为可以从来源作者间的主题共现、合作、引用、同被引以及同部门"个角度,挖掘来源作者间的综合关系。(#)根据不同关联标准分别建立描述作者实例的二元关联矩阵。即每一作者实例分别用一个属性向量来表示,向量值为作者实例与描述属性之间的关联次数。
对于主题共现和同被引矩阵,可以采用机率($)
[!%]
模式计算来源作者间交叉关联度。对于合作、引用和同部门关联矩阵,则可以采用&’()*’算法计算交叉关联度。
(+)鉴于各个关联标准对综合关联度的贡献程度不同,分别设置权重。
(")将基于"种标准获得的关联度值归一化后,根据权重计算归一值的加权平均值作为作者实例间的综合关联度。对每一来源作者,取综合关联度!%,%!且最高的#"名作者作为其关联作者。
(#%%%/#%%0年)来源数据获图$为基于-..-)得的,来自“南京大学信息管理系”的!"位来源作者之间的关联云图。$%!
基于&’()*’的概念属性设置
在很多情况下,仅使用频次并不能完全反映对
象之间的关联程度。例如主题与来源作者之间的关联,并不是说关联频次越高,作者对主题就越重要,这还与作者涉及主题的总个数有关。因此本文引入&’()*’指数作为关联系数来描述实例之间的关联程度。
基于&’()*’算法设置实例属性值的一般过程是:!基于-..-)来源数据统计中心概念实例和关联概念实例的关联次数。"建立中心概念实例1关联概念实例的二元关联矩阵,以关联次数作为矩阵值。#建立适用于描述中心概念和关联概念关系的(!)即为用于计算来源种刊&’()*’公式。如公式(!"#)相对于主题($%)关联度的&’()*’算法,式中&为主题总个数,(!(#)表示与!"#有关系的主题个’数。$将二元关联矩阵中的数值代入&’()*’公式中,计算中心概念实例和关联概念实例之间的关联度。%使用三元组(关联概念实例,关联次数,关联
图!“南京大学信息管理系”"#位来源作者间的关联云图
—$$0—
情报学报 图书情报工作 分析模型
基于本体的12213学术资源网络模型构建及其应用研究
度)描述中心概念实例,作为其关联属性值。(!"#,$%&)!’(")*(!
("#,"!$%&)
"#""!
#$%&’
+
&#$%&’+
晰地显示了各种类型的概念实例之间的关联,以此为导航可以获得与主题“语义网”相关的学术资源信(.’’’4.’’-年)中的所有学息。类似地,将12213术资源实例集成在一起,就形成了一个巨大的基于本体的学术资源网络,在其中能够方便快捷地获取任一学术资源实例的相关信息,以支持知识检索和引文分析服务。
建立概念模型以获得概念库,对原始数据实行语义标引可获得实例库,由概念库和实例库共同构成本体库。基于.’’’4.’’-年的来源数据,历时近&’个月构建成的实验性122135678$是一个/层概念层次结构,共包含/(个本体类、其中//-个属性,
对象关系属性.0/个。此外,为了数值属性*/个,
实现蕴涵推理,建立了含有&0条推理规则的知识
库。在)年的数据中,共标注出了**.*--个主题,*’,’.&篇来源文献,**0种期刊,.*个学科,.&*(,.个来源作者,0(00,个部门等实例。
(&)
以主题概念的来源种刊属性设置为例。首先统计主题在来源种刊中的出现次数。一般认为某一主题在刊载文献中出现,即认为它在种刊中出现一次,而不考虑其在来源文献中具体出现的次数。然后建立主题"来源种刊的关联矩阵,矩阵值为主题在种刊中出现的总次数。将矩阵中的数值代入公式(&)中,计算来源种刊相对于主题的关联度。表&展示了部分主题实例的来源种刊属性值。&’&
基于本体的())(*学术资源集成
本体实例通过对象属性和其他类型概念建立联系,而关系属性又以其他概念作为其对象属性,于是学术概念之间以属性形式串联成一个巨大的网状结构,形成知识网络。根据本体各类概念的基本结构可以将12213(.’’’4.’’-年)中的所有知识实例化,以更合理的面向对象的方式组织学术资源。图“语义网”主题的知识地图,图中清,为基于本体的
表!
主题-…
来源期刊.
…
图书情报工作
语义网
现代图书情报技术情报科学情报杂志情报理论与实践图书情报工作
知识组织
情报理论与实践情报杂志情报资料工作中国图书馆学报情报学报
本体构建
现代图书情报技术中国图书馆学报图书情报工作情报杂志
…
…
频次…()))*.0...’&,&,..&&&…
*122135678$的评价模型
以转变现有的122135678$主要面向知识服务,
!!!!!!!!!!!!!!!!!!!!!!!!
主题的来种刊属性值"#$%(局部)关联度/
…’+’*,’*’+’,-,&’+’,.&’’+’/00(’+’/*/*’+’-/-’’+’*00/’+’,.’/’+’/)(0’+’/-,0’+&.’’’’+&&&)-’+’*0’)’+’*’-.’+’,-0/…
主题-…
来源期刊.
…
现代图书情报技术
语义检索
情报学报情报理论与实践图书馆杂志情报科学情报杂志
数据挖掘
情报科学情报学报
现代图书情报技术中国统计
现代图书情报技术情报杂志
本体
图书情报工作情报学报情报理论与实践
…
…
频次…-*/..-)//./&0&(&0.&&)&,&/…
关联度/
…’+&’--0’+’(*,*’+’*-0(’+’/.)(’+’/..-’+’-&’&’+’/.*/’+’.-0/’+’&(*-’+’&0-,’+’,(.,’+’,0&,’+’,.&.’+’,&&.’+’/)(/…
—//)—
情报学报 图书情报工作 分析模型
情报学报第-.卷第-期-/0/年1月
图!基于"##"$(%&&&’%&&()的“语义网”
主题知识地图
图)
"##"$*+,-.的评价模型
服务模式、改善服务质量、提高服务水平为主要目的。因此对该本体的评价,主要着眼于其实际应用价值。本文提出了专门用于!""!#$%&’(的评价方法,其基本流程如图)所示。
笔者认为应该从本体的正确性、合理性和有效性*个方面来评价!""!#$%&’(。具体地说,!正确性评价是保证本体概念模型不存在逻辑错误和逻辑冲突,包括描述逻辑的一致性检测和包含性检测;"合理性评价是指由领域专家和本体工程师等根据通用的评价原则和标准,如明确性、完整性、共享性、可扩展性等,对建立的本体进行适用性评价,检查其对领域知识组织的合理程度;#有效性评价则是针对
由用!""!#$%&’(在实际应用中的有效性和便利性,户来检测本体的可用性。
在本体构建的不同上述本体评价分*步进行,
—**,—
阶段实施。正确性评价在本体概念模型建立之后进行,合理性评价则在本体语义标注完成后进行,而面向应用的有效性评价则在本体的实际应用中进行。在每次评价后,都可以根据反馈来修正本体。该模型适用于面向用户服务的应用型领域本体的评价。
+基于!""!#$%&’(的应用研究
本体构建是本体应用的基础,而本体应用则是本体构建的最终目的和完善途径。构建!""!#$提%&’(是为了改善现有的!""!#信息服务的质量,
高服务水平。(/0
"##"$信息服务现状
当前!""!#主要应用于信息检索和引文分析
情报学报 图书情报工作 分析模型
基于本体的&’’&(学术资源网络模型构建及其应用研究
服务。
提供信息检索服务。渠道包括光盘检索和(!)
基本功能是根据检索元数据项,实现来源"#$检索,
文献检索和被引文献检索。
(%)提供引文分析服务是&’’&(建立的初衷。
基于现有的数据结构,当前主要进行两个方面的引文分析研究:!基于数理统计的引文分析。即通过对来源数据的简单和回溯统计发现学科规律,评价来源期刊、作者、机构、地区等的学术水平和学术影结果,而希望能够得到更多的相关信息。同样的,基于本体中的同类学术资源关联知识,能够对检索结果进行语义扩展。例如,用户通过检索获得来源文献后,试图获得更多的相似文献以供参考,此时系统可以根据本体中定义的来源文献间关联,向该用户推荐当前结果的相似文献、引证文献、被引证文献、同引证文献、同被引文献等知识。
(-)能够实现学术资源间关系的查询和推理。学术资源之间以属性建立关联,在&’’&(.)/01中,
响,探讨哲学社会科学的学科热点和发展趋势,如苏
新宁[!%]教授等的研究成果。"基于数据仓库和数
据挖掘的引文分析。即构建引文分析数据仓库,实现)*+,,同时采用关联规则和主题聚类等算法挖掘同类对象间的潜在关联,构建知识地图,如邓三鸿
[!-]
等的研究。
!"#
基于$%%$&’()的知识检索服务平台
现有的&’’&(信息检索系统的检索对象单一,
功能简单,仅能够提供有限的服务,这与其直线型的后台数据组织方式有重要关系。笔者通过建立基于本体的学术资源网络模型,以&’’&(.)/01面向对象的结构实现知识的组织。在这种知识结构下,可以建立面向多学术资源对象、实现语义推荐检索和基于规则推理检索的知识检索服务平台(简称23’,.&’’&(.)/01)
,将&’’&(信息检索服务提升到知识服务的层次。23’,.&’’&(.)/01的主要功能包括:
(!)支持多学术资源对象的检索。&’’&(.)/01将主题、作者、文献、期刊、学科、机构等作为主要对象,为各种对象设置属性,因此可以通过各种对象的局部属性特征,检索指定的对象实例,并获得该实例的所有相关信息。
(%)能够实现基于语义关联的学术知识推荐。
!从检索表达式角度来看,
很多用户在检索前期往往对检索意图不明确或希望能够实现查询扩展,这就要求检索系统能够针对用户的查询词进行关联扩展。&’’&(.)/01中明确描述了同类概念实例之间的交叉关联,能够从中得到所有与查询词关联的对象,从而实现查询式的语义推荐。例如用户使用作者检索时,输入“苏新宁”,此时系统将会向用户推荐本体中存在的与“苏新宁”相关的其他作者,如“许鑫”“、邱均平”“、吴鹏”等,供用户选择。"从检索结果角度来看,由于查询式构造难、用户对专业知识理解不充分等原因,用户往往并不满足于获得的检索
因此实例间关系的查询实际上就是属性名称及多元属性值的显示过程。23’,.&’’&(.)/01将学术资源之间的关系分为两个部分:一是本体中定义的关系,二是基于规则的推理关系。例如查询来源作者“杨建林”(主体)和“邓三鸿”(客体)之间的关系,首先在本体定义的关系中,可以查询两者之间存在交叉关联关系;随后搜索规则库,查询相关规则,并根据规则检索出两者之间的推理关系,如合作、被引、共引等,并可以进一步获得推理的路径。!"*
基于$%%$&’()+,的引文分析研究
基于直接统计的引文分析无法揭示学术资源之间深层次的潜在关联,例如作者间关联、学科间关联等。数据挖掘只是一种技术手段,在现有&’’&(数
据结构中直接挖掘,只能得到一些片面的结论,例如基于主题共现挖掘学科间关系等,而对于学科或作者的研究热点、研究趋势等分析,便显得无能为力。因此,本文提出了基于&’’&(.)/01的引文分析方法,在包含现有分析的基础上,试图提高&’’&(引文分析的准确性和全面性,得到一些可供参考的结论。基于&’’&(.)/01的引文分析主要包括以下几个方面:
(!)
基于学术资源统计属性的学术影响力分析。在构建&’’&(.)/01过程中,有意识地为概念设置了统计属性,如基金类别概念的基金类别发文量、年度发文量等属性,便于在进行学术影响力分析时直接获得学术资源的统计数据。此外,本体概念之间的继承关系使得能够实现钻取(45677)操作,例如通过地区(省)发文量分析地区的学术影响力。如果想进一步了解指定“省”的所有“市”的发文情况,则可以根据&’’&(.)/01中定义的省实例和市实例之间的所属关系,实现下钻(45677819/)操作。
(%)基于本体的学术资源关联分析。一方面,在&’’&(.)/01中存储了同类学术资源的相互关系,
根—--:—
情报学报 图书情报工作 分析模型
情报学报第+1卷第+期+/2/年0月
据这种关系可以直接获取任一实例的关联对象,例如与“图书情报档案学”最相关的学科依次是新闻出版广播学、管理学、教育学、法学和经济学,甚至可以列出其关联程度。另一方面,在!""!#$%&’(中使用数据挖掘技术(包括聚类、多维尺度分析等),可以获得更精确、更完善的结论。基本步骤是:从!""!#
$建立学术%&’(中取得同类学术资源之间的关联度,资源)学术资源的二元关联矩阵,以两者的平均关联度作为矩阵值,对关联矩阵进行聚类和多维尺度分析,得到分析结论。例如,图*揭示了“南京大学信息管理系”以二+,位现任教师的多维关联情况,维平面点距离揭示教师间的两两关系。结合图-所示的聚类情况,可以将上述作者分为比较符合实际情况的六大类:一类作者以信息资源管理、文献分析为主要研究方向;二类作者以多媒体信息的处理和检索、自动化技术在数字图书馆中的应用等作为主要研究方向;三类则以竞争情报、市场调研为主要研究内容;四类作者之间的关系相对松散,主要以档案学、编辑出版为主要研究主题;五类可以分为两小类,一小类包括施云、岳泉、谭华军,以信息传播、文献评论等为主要研究主题,存在较多合作,另一小类包括徐雁和叶继元,以文献阅读、评论和期刊评价等编辑学内容为主;六类作者以信息分析、信息安全、网络版权、元数据等数字图书馆理论、情报学基础理论以及产业分析、
电子商务等为主要研究内容。
(.)基于本体的学科热点分析。即根据本体中
存储的主题间关联对主题进行聚类和多维尺度分析,从学科或学科中具有影响力的学者所涉及的热点主题(出现频次高)角度总结出当前学科的研究热
图$
基于综合关联度的学者聚类结果
图!“南京大学信息管理系”"#位学者间关系的多维尺度分析结果
—.0/—
情报学报 图书情报工作 分析模型
基于本体的"##"$学术资源网络模型构建及其应用研究
点。此外,基于主题和来源种刊之间的关系,可以为论文选择合适的投稿期刊。
基于本体的学科或学者的研究热点及趋势(!)
分析。根据"##"$%&’()中的学科或学者与各年度主题的关系,选择学科或学者的热门主题,再基于主题间的关联度对热门主题进行聚类,从而可以获得各年度学科或学者的研究热点,绘制各个热点的年度发展趋势图,从中可以发现学科或学者的研究趋势。
3,1D,];E((B:FFGGG;GDH)8IF2794I’$99J79F#75<’(4=;E(5K;
[+]/7’478#,/)J99<4’(L,M<B)K4N,7(<K;$’9(<’(4<(4)’)O
["]87K<(4)’9O)8975<’(4=<’’)(<(4)’!P8)=77A4’I9)O+,,.$QQQF>$"FN"R
$’(78’<(4)’<K
")’O787’=7
)’
>7?
$’(7KK4I7’=7,+,,.:!.D1!*+;
[D]廖述梅;基于本体的语义标注原型评述[S];计算机
工程与科学,(T):+,,.,+C3+D13+C;
[!]>7K=)57()B8)(UIU[&:][;+,,C13,1D,];E((B:FFP8)(7I7;
9(<’O)8A;7AJ;
[V]W8J?78/@;/)G<8A9B84’=4BK79O)8(E7A794I’)O)’()K)I479
*结束语
本文在分析"##"$数据和服务现状的基础上,提出通过本体面向对象的知识结构来组织"##"$中的学术资源,以达到提高"##"$信息检索和引文分析服务质量的目的。本文提出的基于本体构建"##"$学术资源网络模型的解决方案是可行的,
通过具体的实践———建立基于"##"$%&’()的知识检索服务平台和实现基于本体的引文分析,证明了构建的本体具有实际应用价值。
在本体的具体构建过程中,也遇到了一些问题。本文构建的"##"$%&’()概念模型基于原有的关系型数据库的元数据结构,在领域专家的协助下完成,并通过实际应用对该模型进行了循环改进,但是概念模型的构建需要考虑多方面因素,而且经专家评价和实验验证的机会都不多;本文基于"##"$(+,,,
-+,,.年)
数据来建立学术资源知识网络,数据量相当大,虽然采用机器手段完成了资源的语义标引,但是整个过程是分步完成的,还没有建立一套完整的自动化步骤;对语义标注过程采用的/01$20算
法,虽然采用归一化方法实现了全局范围内关联度的比较,具有一定合理性,但是由此获得的关联度会随主体实例总量的变化而发生改变,不利于实例库的扩展;"##"$%&’()在信息检索和引文分析中的应用还只是初步的,需要更多的实践来进一步验证和改进。这些问题都有待于笔者进一步研究和探讨。
参
考
文
献
3]/45678’7891:77;#75<’(4=>7?@)<A5<B[&:][;+,,C1
J97AO)8X’)GK7AI79E<84’I[S];$’(78’<(4)’<KS)J8’<K)O
YJ5<’")5BJ(78#(JA479,3TTV,!D:T,*1T+C;
[.]R<7A=E7N,#(<<?#;&’()K)IZK7<8’4’IO)8(E7975<’(4=
>7?[S];$QQQ$’(7KK4I7’(#Z9(759,+,,3,3.(+):*+1*T;
[*][9=E)KAR,\4’IR;/)G<8A9<57(E)A)K)IZO)8?J4KA4’I
)’()K)I479["]!>)8X9E)B)’6<94=&’()K)I4=<K$99J794’\’)GK7AI7#E<84’I,Y7KA4’")’]J’=(4)’G4(E$S"N$1TV,R)’(87<K,"<’<A<,3TTV;
[C]N9(8)^<;@7^78977’I4’7784’I)O87K<(4)’<KA<(<?<97()
)’()K)I479["]!P8)=77A4’I9)O(E7Q#>"+,,!HY74A7K?78I:#B84’I781_78K<I,+,,!:D+*1D!3;
[T]M)ZM,@7=()8N;27O4’4’IM1<8Z@7K<(4)’9)’(E7#75<’(4=
>7?[&:][;+,,C13,1D,];E((B:FFGGG;GDH)8IF/@F+,,.FM&/Q19G?B1’1<8Z@7K<(4)’91+,,.,!3+F;
[3,]>7’I##,/9<4YS,:4J#",7(<K;&’()K)IZ=)’9(8J=(4)’
O)84’O)85<(4)’=K<994O4=<(4)’[S];Q‘B78(#Z9(759G4(ENBBK4=<(4)’9,+,,.,D3
(3):313+;[33]#G<8()J(6,@<579EP,\’4IE(\,7(<K;/)G<8AA49(84?J(7A
J97)OK<8I719=<K7)’()K)I479["F&:]!#Z5B)94J5)’&’()K)I4=<KQ’I4’7784’I)ONNN$;#(<’O)8A("<K4O)8’4<),R<89,3TT.HE((B:FFX94;=B9=;J=<KI<8Z;=<F\N>F\N>T.F9G<8()J(F6<’OO%T.%O4’<K%+HE(5K;
[3+]苏新宁;中国人文社会科学学术影响力报告(+,,,1
+,,![)R];北京:中国社会科学出版社,+,,*;
[3D]邓三鸿;知识地图的构造和利用[2];南京:
南京大学,+,,D;
(责任编辑许增棋)
—D!3—
[
情报学报 图书情报工作 分析模型
基于本体的CSSCI学术资源网络模型构建及其应用研究
作者:作者单位:刊名:英文刊名:年,卷(期):引用次数:
王昊, 苏新宁
南京大学信息管理系,南京,210093
情报学报
JOURNAL OF THE CHINA SOCIETY FOR SCIENTIFIC ANDTECHNICAL INFORMATION2010,29(2)0次
参考文献(13条)
1.Tim Berners-Lee.Semantic Web Road map[OL].[2008-10-30]./DesignIssues/Semantic.html.
2.Tenier S,Toussaint Y,Napoli A,et al.Instantiation of relations for semanticannotation[C]∥Proceedings of 2006 IEEE/WIC/ACM International Conference on WebIntelligence,2006:463-472.
3.廖述梅.基于本体的语义标注原型评述[J].计算机工程与科学,2006,28(9):123-128.4.Welcome to protégé[OL].[2008-10-30].http://Protege.stanford.edu.
5.Gruber T R.Towards principles for the design of ontologies used for knowledgesharing[J].International Journal of Human Computer Studies,1995,43:907-928.6.Maedche A,Staab S.Ontology learning for the semantic Web[J].IEEE IntelligentSystems,2001,16(2):72-79.
chold M,King M.Towards a methodology for building ontologies[C]∥Workshop on Basic OntologicalIssues in Knowledge Sharing,Held in Conjunction with IJCA I-95,Montreal,Canada,1995.
8.Astrova.Reverse engineering of relational database to ontologies[C]∥Proceedings of the ESWC2004.Heidelberg:Springer-Verlag,2004:327-341.
9.Noy N,Rector A.Defining N-ary Relations on the Semantic Web[OL].[2008-10-30]./TR/2006/NOTE-swbp-n-aryRelations-20060412/.
10.Weng S S,Tsai H J,Liu S C,et al.Ontology construction for information classification[J].ExpertSystems with Applications,2006,31(1):1-12.
11.Swartout B,Ramesh P,Knight K,et al.Toward distributed use of large-scaleontologies[C/OL]∥Symposium on Ontological Engineering of AAAI.Stanford
(California),Mars,1996.http://ksi.cpsc.ucalgary.ca/KAW/KAW96/swartout/Banff-96-final-2.html.12.苏新宁.中国人文社会科学学术影响力报告(2000-2004)[M].北京:中国社会科学出版社,2007.13.邓三鸿.知识地图的构造和利用[D].南京:南京大学,2003.
相似文献(10条)
1.期刊论文 陈向东.余锦凤 一种基于本体的知识组织工具 -情报理论与实践2006,29(6)
分析了知识组织与知识共享对于开放本体的需求,通过对传统Wiki的改进,设计了一种网络环境下的知识组织工具--开放本体导航工具,讨论了该工具的特点及应用方法.
2.学位论文 李薇 基于本体的知识组织问题研究 2007
本体(ontology)的概念起源于哲学领域,古希腊哲学家亚里士多德将本体定义为研究“存在”的科学,即研究整个客观世界基本特征的科学。20世纪90年代以来,人们将本体的概念引入人工智能、知识工程和图书情报领域,从而使本体概念的内涵也随之发生了变化。这些领域中,一般来说,本体研究是关于知识概念表示和知识组织体系方面的研究.在图书情报领域,本体通常是指一套有关某一学科或某一领域的术语词表,以及术语之间关系的规范和说明。近年来,关于本体的研究与应用呈现出加速度发展的趋势,基础理论更为完善,应用领域更为广泛,技术产品更为成熟.与国外涌现的研究项目和研究成果相比,国内关于本体的研究尚存在较大差距,国内图书情报领域关于本体的研究尚处于起步阶段,尚未见到有关国内构建具有推理功能的学科或领域本体系统的报道. 构建本体的意义在于:
首先,领域本体的目标是捕获相关领域的知识,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇之间相互关系的明确定义。从而实现人们对同一客观事物的共识,形成一个统一的认识事物的标准。即为人类认识活动构建顶层概念框架。
其次,本体更加突出知识共享的功能,尽管二者都对概念间等级关系、相关关系进行了揭示,但本体更着眼于给出人类事物认识的知识(或领域知识
情报学报 图书情报工作 分析模型
)总框架,因为在本体的一个实体中每个概念都有其属性信息、实例信息,而这些在词表系列中则少有展示,很多己经涉及到专业词典中的知识,因此说一个本体是一个人类知识(或领域知识)体系的汇总毫不夸张。
最后,本体的出现还是为了设计一种机器可以理解的语言。通过本体可以克服计算机系统之间的语义鸿沟,实现某个领域内不同主体(人、机器、软件系统等)之间的对话、互操作、知识共享等目的,因此它被认为是一种共享的概念模型的形式化的规范说明。其中形式化就是指应该是机器可读(可理解、可操作)的意思,而这也成为了在计算机网络环境下应用研究的主题之一。
3.期刊论文 冯兰萍.朱礼军.张继国.Feng Lanping.Zhu Lijun.Zhang Jiguo 一种基于模块化本体的知识组织方法研究 -现代图书情报技术2007(12)
针对目前知识组织中存在的问题,将模块化本体引入到知识组织中,提出一个开放的知识组织方法,并分析开放知识组织结构、基本原则、本体模块间语义关系及知识组织算法等.该方法能够将知识分割,将其分配给独立的知识用户,使知识用户能够参与知识的共同构建、维护,从而实现知识的开放组织,在一定程度上降低知识组织的复杂性,提高知识组织的质量和协作能力.
4.学位论文 覃华兵 知识组织工具—本体研究 2005
目前因特网在信息表达和检索方面存在的缺陷成为智能知识检索的一个瓶颈问题,主要是其设计目的是面向用户直接阅读与处理,而没有提供计算机可读的语义信息,因此限制了计算机在信息检索中的自动分析处理以及进一步智能化的信息处理能力。语义网为有效解决上述瓶颈问题提供了新的技术思路。
本体和元数据是语义网的基础。本体(Ontology)作为一种能在语义和知识层次上描述信息系统的知识组织工具,自提出以来就引起了国内外众多科研人员的关注,并在许多领域得到了广泛应用,如知识工程、数字图书馆、软件复用、信息检索等。本体在目前是世界范围内的一个研究热点。
5.期刊论文 董慧.姜赢.王菲.高巾.翁丹丹.曾杰.王超.Dong Hui.Jiang Ying.Wang Fei.Gao Jin.Weng Dandan.Zeng Jie.Wang Chao 基于数字图书馆的本体演化和知识管理研究(Ⅱ)——动态知识组织 -情报学报2009,28(4)
本体分子是在本体的基础之上,结合描述逻辑、图论等相关理论,用于解决动态知识组织管理和控制的理论.本文提出将本体分子应用于数字图书馆领域,建立一个以本体、本体分子为核心数字图书馆知识组织四层模型.本文进而深入地探讨了其中动态知识组织层的实现机制.然后,本文在分析本体分子库结构的基础之上,详细介绍了本体分子建库工具的特点与功能.该建库工具能够较好地解决核子、离子和本体分子等知识组织问题.
6.期刊论文 夏立新.韩永青.张进.Xia Lixin.Han Yongqing.Zhang Jin 基于本体的情报检索学科知识组织体系构建 -现代图书情报技术2008(12)
分析利用本体来构建学科知识组织体系的研究现状,探讨利用本体构建学科知识组织体系的一般流程,以情报检索学科领域的知识为背景,构建情报检索学科知识组织体系,利用Protégé工具对知识本体进行编辑,利用Ontoviz工具实现知识本体可视化.
7.学位论文 张鸣 学科专题知识库的知识组织及实现研究 2005
当今社会,信息呈几何级数增长,但人们却面对“被信息淹没,却饥饿于知识”的困境。知识被淹没在大量的信息里面,越来越难以控制和利用。对知识进行组织成为一个重要的研究内容。
本文将知识组织理论应用于知识库系统,在分析了知识库中知识的概念、类型、以及知识库系统的逻辑结构后,详细探讨了在知识库系统中如何利用现有的分类表和叙词表构建本体,并基于本体进行知识组织模型构造和采用XML语言实现该模型等问题,并通过案例进行了相应的实证分析。全文分为5部分:第一章,概括了知识、知识库系统的概念;分析了知识库与数据库的区别并探讨了图书馆知识组织研究的发展。 第二章,首先论述了学科专题知识库的产生背景,然后阐述了学科专题知识库的涵义及如何构建学科专题知识库。
第三章,阐述学科专题知识库的知识组织涵义,并详细探讨了在知识库系统中如何利用现有的分类表和叙词表构建本体,并基于本体进行知识组织模型构造和采用XML语言实现该模型等问题。
第四章,主要通过一个知识库实验系统的设计,进一步分析知识组织模型的构建过程,以对前面的理论研究进行相应的实践。 结语,对论文进行全面总结,指出存在的不足与今后进一步努力的方向。
8.期刊论文 王军.程煜华.Wang Jun.Cheng Yuhua 基于传统知识组织资源的本体自动构建 -情报学报2009,28(5)
本文介绍了基于现有的知识组织工具和书目数据资源自动构建本体的方法:首先根据书目数据揭示的领域知识建立一个用OWL描述的数据模型,然后从词表、类表和书目数据集中自动抽取对象和关系的实例,写入OWL数据模型,形成书目本体.这是构建本体的一条经济、高效、合理且实用的道路.基于该本体,不仅可以实现概念浏览和语义检索,还可以增强搜索引擎的功能,通过词汇服务实现检索词提示和搜索结果归类.基于<中国分类主题词表>和计算机类的书目数据,本文实现了一个语义检索系统KVision,展现了传统知识组织资源对于网络信息资源利用的潜在价值.
9.学位论文 马建霞 主题图技术在沙尘暴知识导航中的应用研究 2004
随着互联网的发展、语义网的提出和数字化文献的迅速增长,对数字化文献中的知识组织、知识表现成为当前信息资源管理领域和信息技术领域关注的课题.主题图作为一种新型的知识组织技术和知识表现语言,被誉为信息管理和知识管理之间的桥梁,并成为知识组织和知识表现领域的研究热点.该文采用文献调查法、专家咨询法、软件应用开发和比较研究法对主题图的理论问题进行了研究,并展开基于主题图的沙尘暴研究领域知识导航的创新的试验研究,在国内对主题图的研究刚刚起步之际,对主题图技术及其研究现状进行总体把握,探索基于主题图的应用中的原则、方法、步骤等关键问题,研究主题图技术在数字化知识组织方面的适应性,并对主题图及其应用和发展进行评价和展望,以期为国内的同仁们在数字化网络化环境中对采用主题图进行知识组织的研究打下了基础.在该文中首先通过研究主题图技术产生的背景、核心概念和它的理论基础,进行了主题图技术与一些相关知识组织技术的的比较,并进而分析了它对数字化信息组织的适应性;然后概括了在标准体系的建立和研究、主题图在知识管理中的应用、主题图技术与语义挖掘、语义互操作、主题图的可视化、主题图的应用工具以及主题图与其它知识表现语言的互操作等方面的进展.在分析了主题图技术的概念体系和理论基础的基础上,进行了主题图技术在沙尘暴研究领域知识导航中的试验性应用.在试验中,通过对比研究一些典型的基于主题图的应用实例,确定了试验的技术路线,确定了构建主题图本体(ontology)的原则、方法和步骤,试验了主题图的合并机制,选定了两种具有代表性的可视化软件Omnigator和Inxight进行对比,在分析主体图概念模型的基础上,开发了主题图编辑、存储和导出的工具和基于主题图标引文献的工具,并就试验中的有关本体生成、可视化工具、文献标引等方面遇到的问题展开了讨论.最后对主题图技术在数字化知识组织中的适应性、作为知识表现语言的优缺点及主题图应用中的关键问题、主题图的合并机制、主题图对资源环境领域的知识组织的适应性等进行了总结,并就主题图在标准建设、软件发展及其在叙词表应用和编制、网络教育资源的组织、门户网站、电子商务、科研助理等方面的应用前景进行了展望.
10.期刊论文 冯兰萍.朱礼军.张继国.Feng Lanping.Zhu Lijun.Zhang Jiguo 基于模块化本体的知识组织与服务体系研究 -现代图书情报技术2008(7)
针对当前知识组织和服务中存在的问题,提出一种基于模块化本体的知识组织与服务体系结构(Mo-KOS),并分析Mo-KOS自治知识组织的原则、质量控制及其实现流程,探讨自治的、个性化知识服务实施方案.该体系能够向用户提供自治的知识组织、自治的个性化知识服务.
本文链接:/Periodical_qbxb201002019.aspx
下载时间:2010年5月16日
正在阅读:
基于本体的CSSCI学术资源网络模型构建及其应用研究05-26
计算机二级数据库access操作题答案06-05
2015-2016学年度人教版四年级语文下册第五单元测试卷及考试题答案09-06
2014年中国汽配城产业调研报告05-29
3论文大纲范例05-26
中职教师国培心得精选范文5篇最新04-07
伊滨区掘丁路改建工程BT项目一期工程施工组织设计 - 图文05-08
2014年司法考试国际法考点解析:国际法主体带解析05-06
认知过程对多媒体教学过程的启示05-23
Windows下对游戏杆编程12-01
- 教学能力大赛决赛获奖-教学实施报告-(完整图文版)
- 互联网+数据中心行业分析报告
- 2017上海杨浦区高三一模数学试题及答案
- 招商部差旅接待管理制度(4-25)
- 学生游玩安全注意事项
- 学生信息管理系统(文档模板供参考)
- 叉车门架有限元分析及系统设计
- 2014帮助残疾人志愿者服务情况记录
- 叶绿体中色素的提取和分离实验
- 中国食物成分表2020年最新权威完整改进版
- 推动国土资源领域生态文明建设
- 给水管道冲洗和消毒记录
- 计算机软件专业自我评价
- 高中数学必修1-5知识点归纳
- 2018-2022年中国第五代移动通信技术(5G)产业深度分析及发展前景研究报告发展趋势(目录)
- 生产车间巡查制度
- 2018版中国光热发电行业深度研究报告目录
- (通用)2019年中考数学总复习 第一章 第四节 数的开方与二次根式课件
- 2017_2018学年高中语文第二单元第4课说数课件粤教版
- 上市新药Lumateperone(卢美哌隆)合成检索总结报告
- 学术资源
- 本体
- 构建
- 模型
- 基于
- 及其
- 应用
- 研究
- CSSCI
- 网络
- 九年级上册语文13.1行路难(其一)获奖说课教案教学设计
- 深圳外国语学校2012届高三考前模拟(理数)
- 织造质量管理标准
- 2010中国最具投标实力办公家具供应商五十强榜单
- 2012年计算机考研模拟试题
- 《中国移动ENUM-DNS接口和设备规范》征求意见稿V1.0.0
- 加工包子机的领导者
- 氮磷钾用量对烤烟红花大金元产质量的影响
- 工程结构设计原理
- 高二地理复习 区域地1
- 焦裕禄的主要英雄事迹
- 最新苏教版三年级语文上册词语复习题
- 建筑工程质量检测收费项目及标准表
- 会计专业社会实践论文
- 发展机采棉技术 推进规模植棉进程
- 2014年国家公务员行测逻辑判断每日一练周三题目
- 人教一年级下册数学 十几减5、4、3、2教案与教学反思
- 51系列单片机教学实验板硬件设计
- 英语高级视听说下册-unit-10
- 苓桂术甘汤加味治疗杂病举隅