文献检索笔记

更新时间:2024-04-15 23:56:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

1.1学习文献信息资源检索与利用的意义

文献信息资源检索与利用是利用文献获取知识、信息的基本手段。在人类社会生活中有着重要的意义。

1.1.1文献检索是读书治学的基本。

文献检索技能是智能学习的重要组成部分。无论是在求学还是在工作期间,都需要进行各种智能的培养和训练。掌握了文献检索方法如同有了打开知识宝库的金钥匙、泛舟书海的指南,它有助于指引读书治学门径。正如清代学者张之洞在《书目答问·略例》中所指出的:“读书不知要领,劳而无功;知某书宜读而不得精注本,事倍功半。”“得门而入,事半功倍。”可见掌握一定的文献检索知识的重要性。《荀子·劝学篇》云:“不积硅步无以至里;不积细流无以成江海。”从文献检索角度来说,所谓“硅步”和“细流”就是文献检索技能及对检索工具书刊的鉴别、利用知识的积累。对在校大学生来说,正是接受这种技能训练的黄金时代。

1.1.2 文献检索是科学研究的向导。

科学研究首先是从课题调研掌握资料起步的。文献检索有助于掌握本课题研究的进展动态,开拓思路、避免重复劳动,把研究水平提到新的高度。科研成果的评估与鉴定,也需要通过文献检索对相关项目的资料进行查新活动,才能作出正确的结论。特别是在社会科学文献检索系统尚不完备的条件下,文献检索能力的高低,往往影响着科研成果的价值。 1.1.3文献检索是科学决策的先导。

信息化时代的经济管理、政治控制、艺术创造乃至心理状态的演变等,均受到各种社会信息的影响。适时掌握有关信息才能实现有效的管理。因此说,文献检索是进行科 学决策的先行工作。 邓小平同志“开发信息资源,为四化建设服务”的题词,不仅深刻地揭示了信息是宏观决策的重要智力资源,也指出开发信息资源的目的。从信息开发手段来说,也是对文献检索意义的高度概括

1.1.4文献信息检索是人类社会终身学习的基础。

科技的迅速发展使知识的总量呈指数增长,而知识的更新速度也明显加快,这就要求人们具有终身教育的能力,这种能力在很大程度上就是获取新知识的能力,就是对新知识的敏感力和接受力,因而必须掌握文献信息检索的方法。 1.2.1 信息

综合起来,目前大家普遍接受的定义是:“信息是客观存在的一切事物通过物质载体所发出的消息、情报、指令、数据和信号中所包含的一切可传递和交换的内容。” 1.2.1 信息的基本属性

A 普遍性 B 客观性 C 中介性 D 无限性 E 扩散性 F 可知性 G 可贮性 H 共享性 1.2.1信息素养

是一种对信息社会的适应能力,及个人获取信息、评价信息、利用信息的能力的能力,它涉及信息的意识、信息的能力和信息道德。 .2.2 知识

人们在社会实践中所获得的认识和经验的总和,是信息的一部分。也可以说:知识是人类对各种大量信息进行思维分析,加工提炼,并加以系统和深化而形成的结果。 信息---人脑(认识、整序)---知识

如:树叶黄了---秋天到了、缺某种元素、病害。 1.2.2 知识特征

A 属于意识范畴 B 具有不可替代性 C 不可相加性 D 不可逆性 E 不可磨损性 F 不可分性

G 可共享性 H 无限增值性。 1.2.3情报

定义 :人们在一定时间内为一定目的而传递的有使用价值的知识或信息。 特征:

竞争性、传递性、效用性、时间性。 .2.4 文献

记录有知识、信息的一切载体。 基本要素:

A信息内容—文献的核心。

B载体材料—承载文献信息符号的物质材料。

C信息符号—揭示和表达知识和信息的标记符号。记录方式:将包含信息内容的信息符号存储到载体材料上去的方法 2.5文献的分类

按载体类型区分:

1.2.4 文献分类

按照加工程度划分:

零次文献:在非正规物理载体上的未经任何加工处理的源信息叫做零次信息 。如书信、手稿、笔记,会议记录等。 一次文献:指以作者本人的工作经验、观察或者实际研究成果为依据而创作的具有一定发明创造和一定新见解的原始文献 ,由零次文献转化而来。如期刊论文、研究报告、专利说明书、会议文献等。一次文献是作者的原始创作和首次发表,因此,比较新颖可靠,但也会出现不成熟,不够系统的缺陷。

二次文献:将分散的无组织的一次文献经过加工整理,简化和排序,形成系统、便于查找和利用的文献,即检索工具。如书目、索引、文摘、辞典、百科全书等。二次文献的重要性在于给人们提供了一次文献信息的线索,因此,它是人们打开一次文献信息知识宝库的一把钥匙。

三次文献:指对有关的一次文献、二次文献进行广泛深入的分析研究之后综合概括而成的产物 。如文献指南,综述、评述等。三次文献通常是围绕某个专题,利用二次文献搜集大量的有关一次文献,采用科学的方法,对文献的内容进行深度加工编写而成的。 三者的关系:

从一次文献到二次、三次文献是一个由分散到集中,由无组织到系统化的过程,从信息检索的角度来说,一次文献是检索对象,二次文献是检索工具。 1.2.4 文献分类

按照出版特点划分:

图书、期刊论文、科技报告、会议文献、专利文献、技术标准、学位论文、产品样本、产品目录、技术档案、政府出版物、报纸等 1.2.5 文献信息检索

指将文献信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的文献信息的过程,所以它的全称又叫“文献信息的存储与检索,这是广义的文献信息检索。狭义的文献信息检索则仅指该过程的后半部分,即从文献信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻 。 1.2.6 文献信息检索语言

描述文献信息组织与存储的方法或规则,根据检索需要而创造的一种人工语言。 作用:

A保证不同标引人员表征文献信息的一致性。 B使内容相同及相关的文献集中化。

C保证检索提问与文献信息标引的一致性。

D保证检索者按不同需求检索文献信息时,都能获得最高的查全率和查准率。

1.2.6 文献信息分类语言 国内

《中国图书馆分类法》[中图法]

《中国科学院图书馆图书分类法》[科图法] 《中国人民大学图书馆图书分类法》 [人大法] 《中国图书分类法》台湾赖永祥编订 国外

《杜威十进分类法》[DDC] 《国会图书馆分类法》[LCC] 《中图法》

采用“五分法”形成五大部类,这五大部类的依据,首先是毛泽东关于知识分类的论述,即世界上的知识只有自然科学、社会科学和哲学三大部类;其次强调马列主义的指导作用,将马列主义、毛泽东思想经典作家的著作及相关文献独立为一个基本部类;最后是由于文献的特殊性,即存在一些内容庞杂,无法具体归入某一学科的文献,将其概括为“综合性图书”作为一个部类。在五大部类之下,层层细分,划分出22个基本大类,分别为:

中图法:属于等级列举式分类法,特点是类目列举详尽,排列按等级体系,从总体到局部,由大类到小类层层细分,单线列举,形成树型结构,其中的等级体系一般根据学科属性排列。 “Dewey Decimal Classification “ 简称DDC或DC,由美国图书馆学家杜威(Melvil Dewey)创制,是目前全世界使用最广泛、影响最大的图书资料分类法,至少有135个国家和地区的20多万个图书馆在采用。

《杜威法》第一次发表于1876年,书名原为《图书馆编目排架用分类法及主题索引),类表只有12页,加上导言和索引,总共42页。1885年出版第二版,更名为《十进图书分类法及相关索引》,增加了类的级数,加深了细分程度,这一版奠定了《杜威法》的体系。之后到1996年已出版第2l版。

受英国科学家培根的知识分类影响,杜威法将所有的学科归纳成9大类,把涉及全部知识而不能归入任何一门学科的图书总为第0类,称总论,序列在其他学科知识之首。一级大类之下,以圆点相隔再分小类,称子类。每个一级大类再分为10个子类(也有不足或超过的)依此类分下去,形成一个完整的层层展开的等级体系。 分类语言优点

(1)分类语言是以学科划分类目,符合人们认识事物的规律和处理事物的习惯,容易被人们掌握和应用。

(2)分类语言强调知识的系统性,方便人们按学科、专业系统检索有关文献资料,能够达到族性检索,可以获得较高的查全率。 (3)便于组织图书资料排架。

族性检索是对具有某种共同属性或特征的众多事 物、概念的检索 分类语言的不足之处

(1) 检索信息时首先必须了解课题的学科体系才能顺利查找到相应的类目,如果不熟悉学科体系,会有一定难度。

(2) 分类语言采用尽量列举类目的方法,但受到类目数量的限制,缺乏专指性,查准率不高。 (3)由于分类表的结构是固定的,不便于随时修订和增设新的类目。它总是落后于科学技术的发展,难于及时反映新兴学科和边缘学科的内容。

(4) 分类语言采用分类号作为检索标识,检索文献时,需要将检索文献的主题内容转换成分类号,转换过程中,容易产生误差,造成误检。 1.2.6 主题语言

主题:论述的对象和研究的问题 主题语言:以文献信息内容特征和科学概念的词语为检索标识,并按字顺组织起来的一种检索语言。

1.2.6 主题语言 A 标题词语言

标题词:从自然语言中选取并经过规范化处理的、表示事物概念的的词、词组或短语。 代表:EI中《工程主题词表》(简称SHE) 电脑---见(see)---计算机

局域网---参见(see also)---计算机网络 B关键词语言

关键词:指那些出现在文献的标题(篇名、章节名)以至摘要、正文中,对表达文献主题内容具有实质意义的语词,亦即对揭示和描述文献主题内容来说是重要的、带关键性的(可作为检索“入口”的)那些词语。

关键词基本上不作规范化处理。例如,“国际联机检索概论”中的“国际联机”、“联机”、“检索”都是能描述这篇文献的主题的,可以作为检索词。 概括地说,关键词法就是将文献原来所用的,能描述其主题概念的那些具有关键性的词抽出,不加规范或只作极少量的规范化处理,按字顺排列,以提供检索途径的方法。 C 叙词(主题)词语言

叙词是指一些以概念为基础的,经过规范化的,具有组配功能并可以显示词间关系和动态性的词或词组。 如:《汉语主题词表》、《机械工程主题词表》 主题词表: ①字顺表

computerized industrial control

USE industrial computer control Computerized instrumentation UF computerized instruments NT automatic test equipment computerized monitoring computerized spectroscopy computerized tomography BT computer applications TT computer applications RT astronomy computing

astrophysics computing biology computing

chemical engineering computing

1.2 信息、知识、情报、文献的基本概念

1.2.6 主题语言 c 叙词语言

叙词:也称为主题词,是经过规范化处理,以基本概念为基础的表达信息内容的词和词组。也叫受控词 。

概念组配是叙词语言的基本原理

概念组配与字面组配在形式上有时相同,有时不同;而从性质上来看两者区别是很大的。字面组配是词的分析与组合(拆词);概念组配是概念的分析与综合(拆义)。例如: 字面组配 概念组配

模拟+控制-->模拟控制 模拟+控制-->模拟控制

香蕉+苹果-->香蕉苹果 香蕉味食品+苹果-->香蕉苹果 分类语言与主题语言的区别

分类语言 主题语言

以学科和专业集中文献 能将不同学科的信息集中到一起 适宜族性检索 适宜特性检索

不利于新兴学科、交叉学科和边缘学科的检索 不利于新兴学科检索 查全率不高 查准率不高

1.2.7 文献信息检索流程

问题的提出(分析研究课题) →制定检索策略(手检 机检)→ 选定检索工具 确定检索方案 → 查找→ 原始文献 .2.8 文献信息检索方法

为实现检索方案中的检索目标所采用的具体操作方法核手段的总称。检索方法很多,在检索过程中应根据检索系统的功能、检索者的实际需求,灵活运用各种检索方法,以达到满意的检索效果。

1.2.8 文献信息检索方法 A 常用方法(工具法) 1、顺查法

按研究课题的起始年代,利用检索工具逐年进行查找,一直查到最新一期为止。一般用于重大课题和各学科发展史以及新兴学科等方面的研究课题的全满检索。优缺点:检索文献系统性强,查全率高,但费时费力。 2、倒查法

又称“逆查法”。是一种逆时间顺序由近及远地回溯性查找文献地方法,目的是获取近期发表地最新文献信息。是一般科研人员最常用地方法。在确认某项成果是否创新时,也适合用倒查法。优缺点:省时省力,漏检率较高 3、抽查法

是针对某一学科内的课题,重点对某一时间段进行检索,这种方法,多用于检索专题调查报告。优点:检索效果和效率较高

B追溯法

是利用已知文献后面的参考文献或引用文献为线索,由近及远,进行追踪查找相关文献的方法,也叫追踪法或引文追溯法,具体检查法有2种:一种是利用原始文献新附的参考文献追溯检索;另一种是利用专门编制的引文索引进行追溯查找。 优缺点:方法简单,漏检率高,检索效率不高 C 循环法

是将常用法(工具法)与追溯法交替使用的方法,即利用检索工具查找某些文献,又用这些文献所附参考文献或引用文献追溯查找,分期分段地交替进行,循环下去,直到满足检索要求为止,也称分段法或交替法。优缺点:检索效率高 D 浏览法

即对纸质型或电子文献目录内容的浏览方法

第2章 信息资源的质量评估

2.1 可靠性

按检索对象划分信息为文献信息、实物信息、口头信息

原始信息可靠性包括:A真实性 B完整性 C科学性 D典型性 ①文献信息的可靠性评价

a 看作者 b 看出版机构 c 看文献类型 d 看来源 e 看被引用率 f 看引文 g 看程度 h 看密级 I 看内容 j 看实践

②实物信息可靠性评价

a 看实物研制者 b 看生产机构 c 看商标 d 看关键技术内容 e 看实践效果 ③口头信息可靠性评价

a 看发言者 b 看场合

c 看内容 d 看其他听众的反应 2.2 先进性

信息所报道或反映的内容是否在某一领域原有的基础上提出了新的理论、新的观点、新的假说、新的发现,或者对原有理论、原理、方法、技术加以创造性地开发利用。 ①文献信息先进性评价 A 文献外部特征

a 看文件类型 b 看出版机构 c 看发表时间 B 文献计量学特征 C 文献内容特征 D 信息发生源 E 实践效果 ②实物信息先进性评价 A 看生产日期 B 看生产机构 C 看生产手段 D 看信息内容 E 看实践效果 ③口头信息先进性评价

a 看发言者 b 看发言时间 c 看发言场合 d 看发言内容 2.3 适用性

信息对信息接收者可利用程度。

A 看信息发生源和信息吸收者吸收条件的相似性(钢铁技术的引进) B 看实践效果

C 看战略需求(美国星球大战计划) 3.1 工具书:

定义:专供查找知识和信息的工具。针对特定需要,系统汇集某方面的资料,按特定方法加以编排,以供需要时查考用的工具。 特点:

A从编辑目的而言,它主要供查考、检索而非通读。 B从编排方法而言,工具书总是按某种特定体例编排,以体现其工具书性,易检性。 C从内容而言,广泛吸收已有研究成果,所提供的知识、信息比较成熟可靠,叙述简明扼要,概括性强。 D信息密度高 E 资料性 3.1 工具书:

类型:根据工具书的基本性质和使用功能,可以划分为检索性工具书和参考性工具书 共同点:a高度浓缩前人积累下来的知识

b正文和辅助部分的组织都遵循特的编排规律

c 两者的编制目的都是为了遇到疑难时查考之用,而非而非系统阅览。

3.1 工具书: 不同点:

a 参考工具是表述确切的知识信息,属三次文献而而检索工具是描述文献的外在特征或内容特征,属二次文献

b 参考工具提供给使用者的是确切数据,事实或结论,而检索工具提供的是某一文献线索

c 检索工具为满足不同检索需要,在检索途径上设计较为细致、周到。参考工具则在内容的表述上更注重科学性 3.1 工具书: A 检索工具

a 目录是书籍正文前所载的目次,是揭示和报道图书的工具目录、是记录图书的书名、著者、出版与收藏等情况,按照一定的次序编排而成,为反映馆范、指导阅读、检索图书的工具。

A现代图书目录

a国家书目:揭示或报道一个国家在一定时期内出版的所有图书及其他出版物的目录。包括报道最近出版物的现行国家书目和反映一定时期内出版物的回溯性国家书目。

A现代图书目录

b 专科和专题目录: c 个人著述目录 d 地方文献目录 e 馆藏目录 f 联合目录 g 推荐目录 h 书目之书目

B 古代、近代图书目录

a 官修图书目录 官府刻书分中央和地方P36。 b 善本目录p36 c 版本目录 d 丛书目录 e 综合性目录 f 专科性目录 C 的图 碑帖

文摘是简明、确切地记述原文献重要内容的语义连贯的短文。 功能

文摘条目及文摘杂志具有报道、检索、参考和交流等功能,是开展信息交流的重要手段。 文摘的作用

①通报最新科学文献。②节省阅读时间。③引导检索原文。④能够获取因语言障碍无法得到的文献信息。

C 索引是将文献中具有检索意义的事项(可以是人名、地名、词语、概念、或其他事项)

摘录出来并注明出处和位置,按照一定方式有序编排起来,以供检索的工具书。如:《十三经索引》;《二十四史纪传人名索引》;《古今人物别名索引》。

参考性工具书 a 百科全书

概要记述人类一切知识门类或某一知识门类的工具书 ,是知识的总汇与浓缩,一般按条目字顺编排,附有相应的索引,可迅速查检。内容系统简明,严谨权威。 年鉴

以全面、系统、准确地汇集上年度一定范围内的重大事件、新知识、新进展为主要内容的资料性工具书。汇辑一年内的重要时事、文献和统计资料,按年度连续出版的工具书。它博采众长,集辞典、手册、年表、图录、书目、索引、文摘、表谱、统计资料、指南、便览于一身,具有资料权威、反应及时、连续出版、功能齐全的特点。属信息密集型工具书,并提供一定的检索途径。 手册

汇集某一学科或某一主题等需要经常查考的文献信息,供读者随时翻检的工具书。手册就是各行各业、不同地域、不同职业的人在进行某种行为时所需要的一种了解相关信息的材料,方便日常生活或学习。手册中所收的知识偏重于介绍基本情况和提供基本材料,如各种事实、数据、图表等等。通常按类进行编排,便于查找。英文中,常用Handbook 和Manual 表示,前者侧重“何物”(what)一类的信息,如数据、事实等,后者偏重“如何做\”(how-to)之类的问题。 名录

介绍某一方面人物、地名、机构等资料的检索工具 a名人录

介绍某一方面人物生卒年、学历经历、荣誉、著作等资料的检索工具 b 地名录

是收录经审定的规范化的地方名称,并注明所属的国家、行政区划以及在地图集上的具体位置的工具书 c机构名录

又叫机构指南,是汇集机构名、人名、地名等专名及与之相关的资料的一种工具书,具有简明、新颖、确实等特点。名录是一种事实便览性的工具书,虽只提供有关机构、人物等的简要资料,但能起指引情报源的作用,对沟通信息、促进交流、加强协作提供了很大的方便 辞典

主要用来解释词语的意义、概念、用法的工具书。广义的词典包括语文词典及各种以词语为收录单位的工具书;狭义词典仅指语文词典。其整体结构一般由前言、凡例、正文、附录、索引等部分组成。正文以词条的形式解释词目,词条实现有序化编排。从不同的标准或特征出发,词典可分多种类型。汉语词典从内容上着眼区分为语文词典、学科(百科)词典、专名词典三类。 表谱

表谱是以表格、图表、谱系、编年等形式反映历史人物、事件、年代的工具书。它主要用于查考时间对照、人物、史实基本情况、地理等资料,具有将表列事件化繁为简,便于说明与事件之纵横相关问题,使人能够一目了然。按事物类别或系统编制的反映时间和历史概念的表册工具书,是年表、历表和其他历史表谱的总称。表谱简明扼要,提纲挈领,以简驭繁,将纷繁复杂的历史人物、事件、年代用简明的表格、谱系等形式表现出来,具有精要、便览、易查等特点。

图录

又称图谱,是用绘画、摄影等方式反映事物或人物形象的工具书。

类型:主要有历史图录、人物图录、艺术图录、文物图录、科技图录、地图

3.2 工具书排检方法 排检法

指对一定数量的文献或其他信息记录或文献实体(单字或复词)按某一标识及规则进行排序,并按同一标识及规则进行查检的组织方法。排检法应用十分广泛,如检索工具的编制和检索系统的建立,工具书的编制,文献的排架,电话簿、电码本、字符集的编制,各种名单的编排,等等。常用的排检法有分类排检法、字顺排检法、号码排检法、时序排检法、地序排检法等。派生索引法 利用已有的目录、索引,选编专题目录、索引的方法。 形序法

又称形序排检法,是按汉字形体结构的某些共同特点进行排检汉字的方法,包括部首法、笔画法、笔形法等

部首法:实际上是对汉字偏旁的分类,即将相同偏旁的合体字归为一部,每部统属的字,列于该部之首的偏旁即为“部首”。再按部首笔画来排检汉字的一种查字法。

笔画法

是按汉字笔画数之多少为序来排检汉字的查字法。 笔画法原理简单,使用却困难。这是由汉字笔画结构多种多样,书写体与印刷体笔画又多有不同,而且每一笔画下所包括的字数又很不平衡所决定的。

笔顺法

是按照汉字的笔形顺序排字的方法。汉字的基本笔形有点、横、坚、撇、捺、折 号码法

是形体法的一种变形。它把汉字分解为各种笔形,并用阿拉伯数字作为代码,然后将其联成一组数字,再依数字大小为序排列汉字。这种方法的优点是忠码位置固定,检索快;缺点是笔形取号不易掌握。号码法有多种,其中使用最为广泛的有四角号码法,

四角号码法

是根据方块汉字的特点而发明的一种查字法。分别以不同代码代表汉字四个角的笔形并联成为四位数的号码,再依号码大小为序排列汉字即成为四角号码查字法。四角号码查字法,具有不论部首、不数笔画,不知读音也能见字知码和按号查字的特点。但其取号规则繁琐,笔形辨认不准取号也颇周折。

中国字庋撷法,为原燕京大学引得编纂处于30年代为编制我国古籍索引时所采用的排检法。

起笔笔形代码法

这是起笔笔形法的号码化。它把汉字起笔笔形分为横、直、点、撇、角, 汉语拼音字母排检法

此法以《汉语拼音方案》的字母表顺序排列字头,同一字母的再逐一类比,定其先后,如《汉语主题词表》;同音字再按声调(阴平、阳平、上声、去声)排列。目前多数中文工具书和索引都采用汉语拼音字母排检法排列正文条目。如《现代汉语词典》、《新华字典》等。《中国大百科全书》的条目编排还辅以笔画笔形。

注音字母排检法

注音字母是由汉字偏旁改造而成的40个字母,其中分声母24个、韵母16个。 韵部排检法

韵部排检法也称“声韵法”,是我国古代按音韵排列汉字的一种方法。按韵部编排的字典称为“韵书”。利用韵部编排的工具书来查字词,可通过新印本所附的索引先查出该字的韵后,再按韵部去查。如新印本《佩文韵府》和《辞通》都编有首字四角号码和笔画索引。亦可先利用有关的字典查出该字的韵后,间接来查。

按事物性质分类排检法

古代字书《尔雅》开了按事物性质分类编排的先河。后来成为古代类书、政书的主要编纂体例;现代出版的一些手册、年鉴等也有采用这种方法进行编排。

古代类书、政书的列类是传统认知结构的产物。它以儒家文化为核心,沿用了《尔雅》所建立的“天、地、人、事、物”分类体系。对其所辑录的事、文编排次序,先列天地帝王、次为典章制度、后及其他事物的编序方法,无不反映了敬天尊君观念。

四部分类法

我国古代书目分类体系之一。它把古代图书分为经、史、子、集四大部类,每一大部类下再分为若干类、类下再分目。当代所编的《中国丛书综录》第二册《子目分类目录》亦按经、史、子、集四部编排。《中国古籍善本书目》则分为经、史、子、集、丛书5部48类

时序法

又称时序排列法。这是一种按时间先后次序编排文献资料的方法。年表、历表、大事记以及记载人物生平事迹的年谱等工具书,都采用这种编排方法。

地序法

是按照地理区域编排文献资料的方法。主要用于编制地图集、地方资料等工具书,以及各类图书中凡涉及世界各国和国内各地区的,也都采用地序法

3.3工具书的利用【略】 4 网络资源、数据库的应用

4.1 网络资源的利用 计算机信息检索:利用计算机及相关软件和通讯设备,对本地计算机远程服务器上存储的信息进行检索。

特点:检索速度快 途径多 内容范围不同 可检索的数据类型

A 书目数据库 b 数值数据库 c 全文数据库 d 事实数据库 E 超文本数据库 f 网络资源

4.1网络信息资源的概念 网络信息资源:是通过计算机网络可以利用的各种信息资源的总合。包括图书馆的公共书目(OPAC-- Online Public Access Catalogue)、各种联机数据库、Internet上的信息资源等。

网络信息资源内容丰富种类繁多,几乎包含所有专业领域。 机检与手检的异同

手检途径-分类、主题号码、作者名

机检的对象是机读信息,机读信息以数据库(database)的形式存贮 存入的信息同样需要进行标引

标引是将信息中具有检索特征的词语或标志(索引点)抽出制成索引的过程 手检工具采用手工标引而机检系统自动标引 词表-控制标引,正控式和反控式

1正控式如各种分类法、主题表等-手工标引;

2反控式则以禁用词表为代表-自动标引;

禁用词表,例如,用一个由a(an), the, of, for, from, by, to, with, and 九个虚词构成的禁用词表作为控制词表

让计算机自动抽词标引,除这些虚词外的所有词汇均可抽出作为索引点,这样从多个词汇可以查到同一信息。

1.6 按提供的内容网络信息资源可分为:

1.参考型数据库。指引用户到另一信息源以获得原文或其他细节的一类数据库。包括各种书目数据库和引文数据库。这种数据库具有参考和评价的功能,多用于查新、开题。如:SCI、EI、维普的中文期刊数据库??

2.全文数据库。指存储文献全文或其中主要部分的数据库。如新闻消息全文库、法律法规全文库、人大报刊资料库、博硕论文全文库等。

3.事实型数据库。直接提供事实或数值的数据库。如:万方的企业产品数据库、彼得森大学指南等。

4.电子图书。计算机利用计算机检索并下载阅读的图书。如:书生之家、超星数字图书馆、各种数字图书馆等。

5.电子期刊。直接在网上就可以检索和阅读的期刊。如:万方数字化期刊,中国期刊网全文数据库,science online等

6.电子报纸。如:人民日报的网络版。 7.其它类型。如软件,新闻等

叙词字段—规范词字段

●用来描述记录内容的主题词

○这些词经过规范化处理,保证了词和概念一一对应 ○由标引员给出

○收集在相应的规范词表中

◎如INSPEC数据库有INSPEC叙词表;COMPENDEX有SHE标题词表等

例-主题标引 如苏联小说“钢铁是怎样炼成的”(中译本)

题名:钢铁是怎样炼成的 分类号:I512.45 A762A2

主题词:长篇小说-苏联-现代 自由标引词字段-非规范词字段 ○用来描述记录内容的词语 ○非规范词,不在词表中 ○由标引员给出

○这类词相当于一般所说的关键词

基本索引字段比较

●基本索引字段表达了记录的主题内容 ●标引词来源不同 ○叙词和自由词字段

○是在主题分析后,按照一定的情报语言规则标引的 ○有明确的概念含义,能表达确切的主题内容 ○题名、文摘、或正文等字段 ○来源于自然语言

○在整体上或许可以表达原始文献的主题,而其中的某一个词则不一定。 例子《钢铁是怎样炼成的》一书,加工成书目型数据库中的一条记录时, 叙词字段:“ 苏联小说”等, 题名字段:“钢铁是怎样炼成的”,

其中题名中的“钢铁”一词,其字面意思与本书内容风马牛不相及。

基本索引字段比较--结论

通过主题查找文献时,从叙词或自由标引词字段中查找较为准确;而从题名、文摘或正文字段中查找则容易误检。

基本索引字段(Basic Index Fields) 表达文献内容特征,主要有: 篇名字段(Title Field, /TI) 文摘字段(Abstract Field, /AB) 叙词字段(Descriptor Field, /DE)

自由标引词字段(Identifier Field, /ID) 辅助索引字段(Additional Index Fields) 表达文献外表特征

例:作者字段(AU=)、期刊名称字段(JN=)、出版年份字段(PY=)、语种字段(LA=)等。 在检索中,辅助索引一般不单独使用,而常与基本索引配合使用,起限定检索范围的作用。

4.2常用的检索方式

命令检索(command search)

使用特定的操作命令来实施检索 灵活快捷速地进行检索 菜单检索(menu search)

方便,易掌握,称“easy-to-use”检索 多用于光盘检索和web检索 布尔逻辑检索

是当今检索理论中最成熟的理论之一,也是构造检索表达式最基本、最简单的匹配模式。布尔逻辑检索是通过布尔逻辑算符来实现的,这些运算符能把一些具有简单概念的检索词(或检索项)组配成为一个具有复杂概念的检索式,用以表达用户的检索要求。 逻辑运算符有三种:与、或、非

1. 逻辑与:一般用and或 *表示

是一种用于交叉概念和限定关系的组配 它可以缩小减缩范围,有利于提高查准率

凡是用AND的检索式,AND两侧的检索词必须同时出现在同一条记录中,该记录才算命中 如:

? S AU=CHENG, GENGDONG AND PY=1997:1998 ?s Solar*Energy

本文来源:https://www.bwwdw.com/article/0k4p.html

Top