第2章 信息检索原理(建筑学院选修)

更新时间:2023-04-20 15:00:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第2章 信息检索的基本原理与方法2.1 信息检索的基本概念 (1)定义 广义的信息检索(Information Retrieval) 是将大量分散的、无组织的信息按照一定的 原则和方式搜集、加工和存储起来,并根据 用户的特定信息需求,依据一定的规则从信 息集合中查找出有关信息的过程,因此又被 称为信息存储与检索。

(2)类型 根据检索对象的不同,信息检索可分为文献 检索、事实检索和数值检索。 文献检索是指以文献本身为检索对象的检索。 用户需要的是文献内容——间接检索

事实检索是指对事实、概念、思想、知识等 非数值数据的检索——确定性检索数值检索是根据需要查出可回答某一问题的 数据的过程。

2.2 信息存储技术信息存储是指按照一定的原则对信息进行搜 集、著录、标引和排序,使之成为二次信息的过 程,也是信息的组织和编排过程。

2.2.1 信息检索语言在信息的存储过程中,需要对信息依据一定 的原则进行整理和加工,再以一定的方式组织和存 储起来,形成能揭示信息的内容特征(如主题词和 学科属性)及外表特征(如著者、出版者及出处等) 的检索系统。

(1)概念理解信息检索语言是根据信息存储与检索的需要而创制的人工语言。是表 达一系列概括信息内容的概念及其相 互关系的概念标识系统,是信息检索

系统的语言保证。

利用信息检索语言对信息的内容特征加 以表述的过程被称作标引。因此,信息检索语 言又称标引语言。 通过标引而获得的表达信息内容的信息检索 语言符号被称作标识。

(2) 功能 A. 标引(描述)功能 在信息存储和检索过程中,用来描述信息的 内容特征。 B. 集中相关信息的功能 对内容相同或相关的信息加以集中。

C . 组织(排检)功能 将大量的信息以一定的逻辑次序组织和编 排成便于检索和利用的检索工具或检索系统。D. 匹配功能 是信息的标识和检索用语进行相符性比较 的理论依据。

常用的信息检索语言:(1)等级体系分类语言《中国图书馆分类法》

简称(中图法)语言符号:分类号 I247.53

(2)主题法语言《汉语主题词表》语言符号:主题词、关键词读者服务、信息咨询

分类号包括:

纯数字型:例如: 86.13为《科图法》的分类号

字母与数字结合型:例如:TU723.1(施工合同)为《中图 法》的分类号

《中图法》 ,是我国体系分类法的代表 作。语言符号是 字母与数字结合型, 称 为分类号。

该表由 5 大部类、 22 个基本大类的简 表及4万多条类目的详表组成。

五大部类 马列主义、毛泽东思想和邓小平理论

哲学社会科学 自然科学 综合性图书

A马克思

主义、列宁主义、 毛泽东思想、邓小平理论 C社会科学总论 E军事 G文化、科学、教育、体育 I文学 K历史、地理 O数理科学和化学 Q生物科学 S农业科学 U交通运输 X环境科学、安全科学

B哲学、宗教

D政治、法律 F经济 H语言、文字 J艺术 N自然科学总论 P天文学、地球科学 R医药、卫生 T工业技术 V航空、航天 Z综合性图书

主题法语言 主题法语言是直接用自然语言中代表 事物的名词术语(词组)为标识来揭示和 表征文献信息的内容,并按字顺排列标识 和采用参照系统等方法来间接表达各种概 念之间的相互关系的检索语言。

例如: 计算机管理 F 处理机管理 F存储管理 F 虚拟存储 计算机教学 Y 机器教学 计算机结构语言 Z 程序系统 (机器教学 D 计算机教学) (程序系统 F计算机结构语言)

⑤ 主题分析方法主题类型:单主题和多主题 单元主题和复合主题 整体主题和局部主题 主要主题和次要主题 显形主题和隐含主题

主题词的组配: ①概念相交: 例,社会学+心理学=社会心理学 ②概念限定: 例,计算机+应用=计算机应用 ③概念概括: 例,广播+电视+文化事业=广播电视事业

主题结构模式分析法:主题分面公式 主体面——通用面——位置面—— 时间面——文献类型面 例, 信息需求:“中国当代文学评论论文” 文学——评论——中国——当代—— 论文集(期刊)

本文来源:https://www.bwwdw.com/article/56jq.html

Top