计算机信息检索自考考纲
更新时间:2024-01-17 12:38:01 阅读量: 教育文库 文档下载
第一部分 考试大纲说明
一、课程的性质、地位和任务
计算机信息检索课是培养学生的信息检索能力,掌握用计算机方式从互联网中获取知识和情报的一门科学方法课,是提高学生自学能力和独立研究问题能力的工具课。
本课程的任务是:
1.使学生了解文献、信息、信息检索的基本概念,文献类型、数据库的类型、图书的分类体系、当代文献的特点和文献信息检索的意义,引发学生对本门课程的重视和兴趣。
2.使学生了解国内外常用的搜索引擎的功能、特色,掌握利用搜索引擎检索文献信息的方法与技巧、书目信息和事实数据的检索方法。
3.使学生了解网上电子图书、电子期刊、标准、专利文献的特点、功能,掌握其检索与使用方法。
4.使学生了解相关专业的数据库,掌握其特点和使用方法,培养学生获取文献信息的能力。
5.注重培养学生的思维能力,采用课堂讲述与上机操作相结合的方法进行教学,培养和提高学生分析问题和解决问题的能力,使学生完成本门课程的学习任务之后,能够根据实际需求灵活运用各种检索技术查询及获取所需要的文献信息。
二、课程考试要求 (一)考核知识点
考核知识点是对课程知识体系在广度上的概括。就本课程而言,其知识广度主要包括基本理论、基本方法和基本技能,具体内容见本考纲第二部分“考试内容和考核目标”,它们都是考试的范围。 (二)学习要求
要求掌握计算机检索方法,熟练利用网络学术数据库进行科研课题信息检索,了解网络原文获取的方法,学会综合分析、筛选网络信息资源撰写科研论文的方法。 (三)考核目标
关于考核的认知能力目标,本考纲采用了“识记”、“领会”、“简单应用”和“综合应用”四个不同含义而又有递进关系的认知能力层次的词汇来描述。
四个认知能力层次的词汇及其用于测量难易程度的词汇,在本课程中的含义是:
识记:一是指能记住、识别并能正确表述出所规定的基本概念、专业术语和基本方法的要义;二是指能在指定方法技能条件下,会简单地应用于实际。
理解:一是指能用自己的语言简述已学过的知识点,或对它们作出较为全面的叙述;二是指能对存在多种表达方式的知识点作出不同的表述;三是能根据知识的内涵,对相应的知识点能作出简单的判断。
应用:能将已学过的多个知识点或全部的知识综合起来,正确简答较为复杂的问题,或能完整叙述某一复杂的问题。
考核目标三个认知能力与难易程度的量化之间的递进关系是层层深入,每一层次中又包含着区别易、中、难的不同层次。在本考纲第二部分第三个项目下,是按这种递进关系来表述的。再加上这三个层次与学习要求中的三个层次发生交叉的对应关系,使得本考纲第二部分的“学习要求”、“考核知识点”和“考核目标”之间,在知识的广度、深度上的转化方面,形成一个定性的和定量化的有机整体,从而使自学、考试和命题都能达到可测量的程度。
三、自学方法指导
1、在开始阅读指定教材某一章之前,先翻阅大纲中有关这一章的考核知识点及对知识点的能力层次要求和考核目标,以便在阅读教材时做到心中有数,有的放矢。
2、阅读教材时,要逐段细读,逐句推敲,集中精力,吃透每一个知识点,对基本概念必须深记得理解,对基本理论必须彻底弄清,对基本方法必须牢固掌握。
3、在自学过程中,既要思考问题,也要做好阅读笔记,把教材中的基本概念、原理、方法等加以整理,这可从中加深对问题的认知、理解和记忆,以利于突出重点,并涵盖整个内容,可以不断提高自学能力。
4、完成书后作业和适当的辅导练习是理解、消化和巩固所学知识,培养分
析问题、解决问题及提高能力的重要环节,在做练习之前,应认真阅读教材,按考核目标所要求的不同层次,掌握教材内容,在练习过程中对所学知识进行合理的回顾与发挥,注重理论联系实际和具体问题具体分析,解题时应注意培养逻辑性,针对问题围绕相关知识点进行层次(步骤)分明的论述或推导,明确各层次(步骤)间的逻辑关系。
第二部分 考核内容与考核目标
第1章 互联网信息资源
一、学习目的和要求
通过本章的学习,考生应掌握因特网信息资源的种类和特点,了解因特网信息资源的评价方法。 二、考核知识点与考核目标
(一)因特网上的信息资源(次重点)
网上有什么样的信息:政府信息、科研信息、教育信息、文化信息、休闲娱乐信息。
网上不太可能有的信息:如有并企业公司的战略、发展规划,商业、贸易秘密;商业性库和大多数有版权的印刷资料等。
因特网上信息资源的特点及信息利用价值
因特网信息的特点:无限性和广泛性,多样性,共享性,新颖性,无序性。 因特网信息的优越性:价廉,新颖、深入,广泛直接交流,非正式和自由发表园地。
1、识记:网上有什么样的信息;网上不太可能有的信息;因特网上信息资源的特点和优越性。
2、理解:初步认识因特网信息资源和学习网络信息检索的意义;因特网信息资源与传统信息的区别。
(二)因特网上信息资源的种类(重点)
因特网上信息资源的主要类型有以下五种: (1)Web 信息资源
指建立在超文本、超媒体技术的基础上,集文本、图形、图象、声音为一体,并以直观的图形用户界面展现和提供信息的网络资源形式。
(2)Telnet 信息资源
指借助远程登录(remote login),在网络通信协议Telnet(telecommunication network protocol)的支持下,在远程计算机上登录,使自己的计算机暂时成为远程计算机的终端,进而可以实时访问、使用远程计算机中对外开放的资源。
(3)FTP 信息资源
FTP(file transfer protocol) 是因特网使用的文件传输协议。该协议的主要功能是完成一个系统到另一个完整的文件拷贝。即在因特网的联网计算机之间传输文件。
(4)用户服务组信息资源
由一组对某一特定兴趣的网络用户组成的电子论坛。如新闻组(usenet newsgroup)、邮件列表(mailing list)、专题讨论组(discussion group)、兴趣组(interest group)、辩论会(conference)等等。
(5)RSS信息资源
RSS是一种用于共享新闻和其他Web内容的数据交换规范,是将用户订阅的内容传送给他们的通令协同格式。
1、识记:万维网信息资源、Telnet 信息资源、FTP 信息资源、用户服务组信息资源、RSS 信息资源的定义
2、理解:因特网信息资源的五种类型目前的应用情况。 3、应用:分别对因特网信息资源的五种类型进行举列说明。
(三)因特网信息资源的评价(次重点) 1、对因特网信息资源进行评价的意义。 2、因特网信息资源的评价标准 (1)目的 (2)范围
(3)内容:准确性、权威性、新颖性、独特性、可靠性、图形和多媒体设计、信息的展示与设计、可操件性。
3、评价方法 (1)定性评价
按照一定的评价标准对被评站点的各方面特征、质量作出主观评判。一般有问卷调查、专家评议等方式。
(2)定量评价
是利用数量分析方法,对调查统计数据进行分析,进而做出较系统、客观的评判。
定量评价主要从以下途径进行:从网页的URL中得到信息;查看网站首页描述;从超级链接中获取信息;参考他人评价。
1、识记:因特网信息资源的评价标准和评价方法,定性评价和定量评价的定义。
2、理解:对因特网信息资源进行评价的意义。 3、应用:任选一网站,对其信息资源进行评价。
第2章互联网信息检索概论
一、学习目的和要求
通过本章的学习,考生应了解因特网信息检索的主要特点,了解因特网信息检索的各种方法和工具,掌据因特网信息检索工具的工作原理,学会如何对因特网检索工具的性能进行正确的评价。 二、考核知识点与考核目标
(一)因特网信息检索的特点(次重点)
与传统信息检索方式相比,因特网信息检索的主要特点是:
(1) 检索范围大 (2) 检索效率高 (3) 检索工具强大 (4) 信息冗余大
1、识记:因特网信息检索的特点
2、理解:比较因特网信息检索与传统信息检索方式。
(二)因特网信息资源检索的方法和工具(重点)
因特网信息检索的方法主要有两种:基于浏览的检索方式和基于关键词的方式。
1、基于浏览的检索方式
包括不依靠任何检索工具的浏览和借助检索工具的浏览。 (1)不依靠任何检索工具的浏览
顺链而行:此为在因特网上发现和检索信息最原始的方法,即在日常的网上漫游过程中,随机地发现一些有用的信息。
收藏网址:个人用户在上网浏览的过程中将一些常用的站点地址记录下来,组织成目录以备今后之需。
不依靠任何检索工具的浏览方式,适合以下几类信息检索的目的:延伸已有
信息范围;跟踪新信息;网上信息调研;好奇心驱使;消遣性浏览;享受浏览经验。
(2)借助检索工具的浏览
借助以Yahoo为代表的网络资源目录。 (3)基于浏览的检索方式的特点
优点:能够针对具体任务或问题找到相关信息;方便对检索到的结果信息进行筛选;在检索过程中,能够使用不太明确的信息需求得以清晰化;有时能获取一些意外信息;容易使用突破本学科领域的界限,获取跨学科、跨得业信息;利于多媒体信息的检索。
缺点:用户获取信息的偶然性大;检全率较差;易出现信息迷航。 2、基于关键词的检索方式
(1)基于关键词的检索的工具:最具代表性的是搜索引擎,如google。 (2)基于关键词检索的特点
优点:检索简单易得,利于上手;检索到的信息较新,时效性好;可以达到较高的检全率;符合检索语言的文献保障原则和用户保障原则。
缺点:关键词语言难以反映词间的相关关系;分散主题,影响查准率;自动标引无法完全解决标引不一致的问题。
(3)常用的关键词高级检索功能
主要的功能有:布尔逻辑检索、截词检索、位置检索、加权检索、词组检索、范畴检索(限制检索)、概念检索、模糊检索、深入检索
①布尔逻辑检索(boolean logic)
所谓布尔逻辑(又称布尔代数),是指使用AND、OR或NOT 等运算符查找含有某种词语特定组配形式的那些网页(记录)。
逻辑“与”
用AND(或+)表示。A AND B (A+B) ,网页记录中必须同时包含A、B两个词。
逻辑“或”
用OR表示。A OR B ,表示只要含有其中一个检索词或同时含有这两个检索词的文献都将被命中。
逻辑“非”
用NOT (或-)表示。A NOT B (A-B),表示被检索文献在含有检索词A而不含有检索词B时才能被命中。
②截词检索
检索时输入检索词的局部(词干)进行非准确性检索匹配。主要用于西文检索工具。
③位置检索(靠词检索)
运算符NEAR 可以容许两个词相距一定的距离,有时还可以由用户来规定它们之间的距离。
④词组检索
词组检索是一个词组(通常用双引号“”括起)当作一个独立运算单元,进行严格匹配,以提高检索的精度和准确度,它也是一般数据库检索中常用的方法。
⑤范畴检索
是指将检索限制在记录的一个特定部分或几个部分的能力。 一些有用、经常遇到的范畴下: Title(网页标题)
Links(链接) Date URL
图像和其他媒体 特殊检索功能
1、识记:因特网信息检索的主要方法和工具及其各自的特点,主要的关键词高级检索功的定义。
2、理解:如何提高关键词检索的效果。
3、应用:举例比较因特网信息检索不同方法的优缺点;举例说明关键词高级检索功能的使用方式。
(三) 因特网信息检索工具的工作原理(重点)
网络信息检索工具的原理 (1)网页抓取 (2)文档分析 (3)建立索引 (4)文档表示 (5)归类和聚类
理解:因特网信息检索工具的工作原理。
(四) 因特网检索工具的性能评价(次重点) 网上信息检索工具的评价主要从5个方面进行。 1、收录范围
从网络信息检索系统的数据量、收录项目、索引深度、新颖性及更新频率、索引建立方式、处理语言等方面进行评价。
2、检索功能
从检索方式单一还是多样;所使用的检索技术是否先进、多样;对所查信息是否有选择与限定的自由这三方面来评价。
3、检索效率
目前较广采用的信息检索指标是检索全率与检准率。 4、检索结果的处理和展示 5、用户界面设计
用户接口的设计是评价检索系统一个重要的因素。
1、识记:因特网检索工具性能评价的主要指标。 2、理解:如何综合评价因特网检索工具的性能。
第3章互联网检索工具(一)——搜索引擎
一、学习目的和要求
本章的学习偏重实践环节。通过本章的学习,考生应了解搜索引擎的发展简史,在实践过程中熟悉中外著名的搜索引擎的特性和使用方法。 二、考核知识点与考核目标
(一)搜索引擎发展简述(一般)
所有搜索引擎的祖先是1990年由蒙特利尔大学的学生Alan Emtage、Peter Deutsch等人发明的Archie,用于检索FTP文件。
1994年4月出现第一个搜索引擎--Webcrawler,同年,Lycos是搜索引擎史上又一个重要进步,是最早具有现在意义的搜索引擎,发布于1994年7月。
1995年AltaVista和Excite问世 1996年HotBot出现 1997年Northen Light 出现 1998年Google 问世。
理解:了解搜索引擎发展简史。
(二)通用搜索引擎(重点)
通用搜索引擎是相对于专业搜索引擎而言。通用搜索引擎是一种“大众资源”,试图为每个人提供所有的信息信息。通用搜索引擎使用方便,对信息查询反应迅速。
介绍国外著名搜索引擎: Google www.google.com Alltheweb www.alltheweb.com Ask Jeeves www.ask.com MSN www.search.msn.com Lycos www.lycos.com
AOL http://search.aol.com Excite www.excite.com Altavista www.altavista.com Go www.go.com 介绍国内著名搜索引擎: 百度 www.http://www.wodefanwen.com/ 中国搜索 www.zhongsou.com 3721 www.3721.com 天网 http://e.pku.edu.cn
对各个搜索引擎从以下3个方面来进行详细介绍:
(1)数据库规模与范围。例如:Google到2004年2月宣布它拥有世界上最大的搜索引擎数据库,标引了大约43亿左右的文本文档。Google的信息门类也非常介全。除普通的网页数库以外,它还拥有一个图像数据库和一个新闻数据库等。 (2)检索界面
包括搜索引擎首页的特点和结构,高级搜索的入口。 (3)检索功能
检索功能首先要了解搜索引擎是否支持布尔逻辑检索功能。以Google为例,Google支持不完全的布尔逻辑。在检索框中输入的所有检索词,Google会自动以AND逻辑连接;Google也支持OR逻辑操作,但注意在进行“或”操作时OR逻辑操作符必须大写。除布尔逻辑功能,还考察搜索引擎是否具有词组检索、截词检索和范畴检索的功能,其中范畴检索对哪些范畴进行了限制。
应用:在互联网上对著名的国内外搜索引擎进行熟悉,用检索实例掌据搜索引擎的特性和功能。
(三)元搜索引擎概述(重点)
元搜索引擎的概念
元搜索引擎(metasearch engine ,megasearch engine 或 unified search engine) 又称为集合式搜索引擎。它是将多个搜索引擎集成在一起,并提供一个统一的检
索界面。
2、元搜索引擎的分类
元搜索引擎按运行方式的差异可以为桌面元搜索引擎和在线搜索引擎,其中前者的代表是各类搜索软件,而后者按照功能又可以划分为All-in-One式元搜索引擎和并行检索式元搜索引擎。
桌面元搜索引擎
不是通过网上调用方式在线使用,而是直接在用户的计算机上运行,相当于用户自己拥有一个元搜索引擎。
(2)All-in-One式元搜索引擎
又称搜索引擎元目录,它将主要的搜索引擎集中起来, 并按类型或按检索问题等编排组织成目录,帮助、导引用户根据检索需求来选择适用的搜索引擎。
(3)并行检索式元搜索引擎
将多个搜索引擎集成在一起,提供一个统一的检索界面;且将一个检索提问同时发送给多个搜索引擎,同时检索多个数据库,再经过聚合、去重之后输出检索结果。因而又被称为simultaneous unified search index (SUSI)。
3、元搜索引擎的特色和评价
目前运营的元搜索引擎各具特色,功能各有侧重,完全理想的尚不多见。评价一个元搜索引擎主要从4个方面进行。 (1)所集成搜索引擎的数量和名称
(2)检索提问的输入及处理
(3)其他检索选项,如等侯时间、检索作业方式和其他检索参数等。 (4)检索结果的处理 4、元搜索引擎的主要缺欠
(1)常常严格限制从别的个别搜索引擎检索到的记录的数量(有时只有10项)
(2)检索式过于复杂时难以进行转移
(3)在多数情况下,对五大搜索引擎,它们只能检索其中的两三个. 5、元搜索引擎的适用性
通常在下列几种情况下比较适合使用元搜索引擎
(1)在查询极不明确时
(2)想检索的感兴趣的网站少于10个时 (3)检索只使用一个单词或词组时
(4)搜索的记录多数出现在较小的搜索引擎上时
1、识记:桌面元搜索引擎、All-in-One式元搜索引擎和并行检索式元搜索的
概念
2、理解:元搜索引擎的分类、元搜索引擎的评价方式
(四) 常用的元搜索引擎(次重点) 1、常用的桌面元搜索引擎
目录国内比较流行的桌面元搜索引擎有飓风搜索通和网际狂搜,可由网上下载。
2、常用的All-in-One式元搜索引擎 比较有代表性的All-in-One式元搜索引擎有 iTools,www.itools.com Hotbot,www.hotbot.com
CUSI,www.usask.ca/cusi/cusi.html 3、常用的并发式元搜索引擎 Dogpile,www.dopile.com Vivisimo,www.Vivisimo.com MetaCrawler,www.metacrawler.com Profudfsion,www.profusion.com 搜星, www.soseen.com
本节所列不同类型的常用元搜索引擎,主要从以下几个方面进行分析:收录范围、检索特点、结果显示和评价。
应用:上机熟悉各类常用元搜索引擎。
第4章互联网检索工具(二)——目录型网
络检索工具
一、学习目的和要求
通过本章的学习,考生应了解网络资源目录的收集和维护方式,目录的结构和使用方法及网络资源目录目前使用的主要分类法,并且应熟悉和掌据几个国内外著名的网络资源目录的特性及使用方法。 二、考核知识点与考核目标
(一) 目录型网络检索工具概述(重点) 1、目录型网络检索工具原理
因特网上的目录型检索工具一般称为网络目录(Web Directory),它是由网络开发者将网络资源收集后,以某种分类法进行组织整理,并和检索法集成一种可供分类浏览和检索的等级结构式目录。网络目录一般是通过引导网络用户的查询概念来帮助用户找到所需的网络信息。 2、目录资源的收集和分类
(1)收集
网络目录一般采用人工或半自动方式采集和存储网络信息。 (2)分类
网络目录通常是按网络资源的主题性质进行分类,以某种分类体系为依据,将信息资源分为若干领域的主题范畴,然后再细分为各学科专题目录,最后列出具体的相关网站(资源),形成一个由信息链组成的树状结构,即总目—— 专题目录—— 链接—— 文本。
目录资源的收集和分类优点是人工方式建立的查询工具其检索信息的准确性较高;缺点是收集信息的效率及全面性低于自动方式。目前,部分网络资源目录利用自动功能或者由用户递交的方式来丰富和补充资源。 3、网络目录结构
一个网络目录包括许多层,最高层(一级)目录页总是将因特网资源分成最大范围、最普通的主题范畴。主题链接到第二层目录(另一个页面),然后在第
二层目录再分出子目录,一般到第四级。
4、网络资源目录分类方法 (1)主题分类法
一个主题充当一个类目,类目象主题词表一样按字顺排列,一个类目又可分为若干细目,同位类的细目也是按字顺排列。
主题分类法的优点是以事物分类, 与些事物相关的内容全部集中在一起;对交叉学科的主题提示非常有利。缺点是此分类法容量小, 对网络资源的覆盖率极为有限。
(2)学科分类法
以知识分类为基础、按照学科性质及从属、层次关系来组织网络资源,类目排序以字顺为标准。
学科分类法按照学科性质来组织网络资源。比主题分类法有更大的容量,内容更有针对性,学术性,符合研究人员的要求。
(3)图书分类法
网上的虚拟图书馆多用图书分类法,目前采用的主要有杜威十进分类法(DDC)、国际十进分类法(UDC)、国会图书馆分类法(LCC)和中国图书馆分类法。
图书分类法的特点是:以科学体系为基础,体系宠大,容量上占优势; 网络用户对其了解较多;版本更新及时,能满足动态的网络信息分类;有机读版本,网络资源目录可以直接套用。
(4)分面组配法
这种分类法的原理首先确定几个分类标准,即分面,再确定每个分类标准中的若干特征值,即类目,每一分面的类目与其他分面的类目分别再组配,形成许多组配类目,达到细分的目的。多用于地图检索专业工具。
1、识记:目录型网络检索工具的工作原理。
2、理解:网络资源目录的收集和维护方法和目录结构;网络资目录所使用的分类法各自的特点。
(二) 网络资源目录介绍(次重点) 国外著名的网络资源目录
Yahoo! , Galaxy, VL, BUBL LINK, Dmoz, LII 国内著名的网络资源目录
雅虎中国,搜狐分类目录,新浪分类目录
重点了解Yahoo! , Galaxy, VL和BUBL LINK的特点和使用方法。 1、Yahoo! www.yahoo.com
1994年创建,是最早最著名的目录型网络检索工具,也是最流行的网络资源目录。
收录范围包括网站、Web页、新闻组、FTP等资源。在专题安排上,即包括了学术资源,也包括了大量的非学术资源和许多娱乐资源。
分类特点以主题为基础。 具有关键词检索功能
评价:目录分类比较合理,层次深,类目设置好,克服单纯由搜索软件动完成分类的缺陷,增强分类的条理性。它的分类体系和搜索模式对网络检索的发展产生了巨大的影响。
2、Galaxy www.galaxy.com
编制:1994年创建。最初动因是开发用于电子商务的大型目录指南服务。 目录特点:其目录链接了因特网上的数千个站点,它不但提供分类目录查询,也具备一定的检索功能
主题递交:通过表格操作向该服务器提交增补主题内容的建议。
评价:由专家使用人工智能等最佳技术组织信息,目录分类更加细致合理。 3、The www Virtual Library (VL) www.vlib.org
编制:VL是老资格的Web目录,由松散的志愿者联盟来管理和维护。 收录范围:主要收集各学科专业领域网络信息。
目录特点:参照美国国会图书馆主题词表对网页加以组织。
检索方法:主要通过目录的导引和浏览,检索者最终调出不再含任何链接的文献类文本。
评价:该系统称得上是专业性网络信息资源目录的集大成之作。在世界范围
内影响广泛,内容不得经常更新,具有很高的学术性。
4、BUBL LINK,http://bubl.ac.uk/link
编制:源于1990年,目前发展成为英国一项重要的国家网络信息服务,主要为高等教育团体服务。
收录范围:覆盖了所有学术领域的经过选择的网络资源目录。目录按照杜威十进分类法(DDC)的体系组织编排。
检索功能:按DDC 分类浏览;按主题字顺浏览;输入检索词检索。 评价:目录体系庞大,用户检索容易、快捷,查找的结果更相关。
1、理解:国内外著名搜索引擎的特点及检索方式。
2、应用:以一个检索主题分别使用Yahoo! , Galaxy, VL和BUBL LINK进行
检索,从收录范围、分类方法、目录特点、检索功能和结果显示对四者进行比较,发现其各自的特性。
(三)网络资源目录与搜索引擎的比较(重点) 网络资源目录与搜索引擎适用不同的检索需求。
网络资源目录主要适用于:用户进行较宽泛的主题浏览和检索;用户尚未形成很精确的检索概念时。
与搜索引擎比较,网络目录具有下列的特点:网络目录中的网页是由专家人工精选得来的,故网页内容丰富,学术性强;分类浏览方式直观易用,适合多数网络用户和新手;当用户检索目的不明确,检索词不确定时,分类浏览方式更为有效;有较高的查准率。
网络资源目录的局限是:受人工标引的限制,搜索范围较搜索引擎要小许多;收录的网页数量和标引浓度相对不足;难以控制主题等级类目的质量。
理解:网络资源目录与搜索引擎相比具有的优缺点。
第5章多媒体信息检索
一、学习目的和要求
通过本章的学习,考生应了解图像、音频、视频等多媒体文档的检索原理和检索工具。
二、考核知识点与考核目标 (一)图像的检索(次重点) 1、图像检索的原理
(1)基于文本的图像检索技术
该技术是利用文本方式描述图像的特征,如绘画作品的作者、年代、流派、尺寸等。这种技术目前在因特网图像信息检索系统中占主导地位。
用来帮助图像分析、标引的Web文档内容包括: 图像的文件名及其网址; 图像的替代文字; 图像周围的文字; 图像所在页面的标题; 图像的超链接;
图像所在网页彼此间的链接。 (2)基于内容的图像检索技术
对图像的内容语义,如图像的颜色、纹理、布局等进行分析和检索的图像检索技术。此技术出现于20世纪90年代初期。该技术用于因特网图像信息的检索克服了基于文本的图像检索技术存在的缺陷。
2、基于文本的图像搜索引擎 (1)Images.google.com
容量大、速度快、无用信息和死链接较多。 检索方法:一般搜索和高级搜索。 结果显示:缩略图。 (2)AllTheWeb 多媒体搜索
一流的多媒体搜索功能,收录了图像、音频、视频等多种。
检索方法:提供一般检索和高级检索。在高级检索界中可以选择文档大小和颜色来进行限制检索。
结果显示:一次检索结果提供缩略图 还有其他比较有代表性的图像搜索引擎,如
http:// Gallery.yahoo.com www.picsearch.com www.ditto.com Image.http://www.wodefanwen.com/
3、基于内容的图像搜索引擎
基于内容的图像搜索引擎还处于研制阶段,目前属于真正意义上的基于内容的图像搜索引擎还不是很多,比较有代表性有: QBIC,www.qbic.almaken.ibm.com
VisualSEEK 的 WebSEEK, http://persia.ee.columbia.edu: 8008/
1、识记:基于文本的图像检索技术、基于内容的图像检索技术 2、应用:熟悉有代表性的图像搜索引擎的使用方法。 (二)音频文件的检索(一般)
1、音频文件检索原理
音频检索比较简单的办法是把音频作为一种不透明的数据集合来处理,仅涉及它的文件名、文件格式和采样等外部特征。这种方法和基于文本的图像检索是相似的。
用基于外部特征方法来实现歌曲的检索,在实际应用中取得了很好的效果,但它的局限性在于,它只适合歌曲检索,而对其他类型的检索要求就无能为了,比如用户要根据一体贴曲子的旋律片断来找整曲以及其他旋律相似的曲子,这种检索方式就无法解决了。基于内容的音频检索系统可以解决这一问题。
基于内容的音频检索主要包括的检索方式有:基本属性检索、相似性、声音/感知特性检索、主观特性检索、示例检索。
2、基于文本的音频搜索引擎
Mp3.com,www.mp3.com
CNET Download.com,download.com
Kazaa Media Desktop (MP3 only),www.kazaa.com 音乐极限,www.chinamp3.com 3、基于内容的音频搜索引擎 上海交通在学音乐数据库检索系统 ThemeFinder,www.themefinder.com
应用:熟悉音频搜索引擎的使用方法。
第6章学术信息的网上检索与获取
一、学习目的和要求
通过本章的学习,考生应了解一些综合性和专门学科的重要检索系统、检索工具和信息服务站点,并掌握其检索功能。 二、考核知识点与考核目标
(一)综合性学术信息检索系统(重点)
1、国外检索系统
(1)ISI Web of Knowledge,isiwebofknowledge.com
该系统由美国 Thomson Scientific 创建,收录文献类型有学术期刊、技术专利、会议录、化学反应、研究基金及网站资源等。收录学科范围有自然科学、工程技术、社会科学、艺术与人文科学信息资源。
该系统的检索功能提供跨库联全检索和资源无缝整合两大功能。在检索技巧上,ISI Web of Knowledge 在大小写、运算符、通配符、括号的检索途径规则与通用规则方面基本相同。
(2)OCLC的FirstSearch检索系统
FirstSearch是由美国OCLC创建的。OCLC( Online Computer Library Center,INC) 是一个非赢利,成员制的在线计算机图书馆服务和研究机构,也是世界上最大的文献信息服务机构之一。包括期刊论文、图书、专利、政府报告、报纸、学位论文、会议论文、视频音频等文类型。学科范围包括艺术和人文学科,工程和技术等综合性学科。目前通过该系统可检索70多个数据库,其中30多个可检索到全文。
(3)Proquest,www.il.proquest.com/umi/
该系统由美国ProQuest Information and Learning Company创建和开发。收录文类型包括期刊论文和报纸,收录学科范围广,涵盖艺术与人文、工商业、计算机与因特网、经济与贸易、教育、科学与数学等。
(4)EBSCOhost
该系统收录学科范围为综合性。文献类型包括期刊、报纸、参考工具、网络
资源等。
(5)Springer Link,www.springerlink.com
收录学科主要是理工科类。收录文献类型有电子期刊、电子书、电子丛书、多媒体。
2、中文检索系统
(1)CNKI平台,www.cnki.net
收录范围包括自然科学、工程技术、人文与社会科学等。收录文献类型有期刊、博士硕士论文、报纸、图书、会议论文。
(2)NSTL网络服务系统,www.nstl.gov.cn (3)CSDL,www.csdl.cn (4)CALIS,www.calis.edu.cn
1、识记:主要综合性学术信息检索系统的名称。
2、应用:熟悉各种综合性学术信息检索系统的使用方法。
(二)各学科信息资源的获取(一般) 1、社会科学信息资源检索工具
(1)Social Science Information Gateway (SOSIG), http://sosig.esrc.bris.as.uk (2)社会科学研究网 Social Science Research Network (SSRN), http://www.ssrn.com
2、教育信息检索工具
(1)ERIC Web Site —— ERIC 数字图书馆 www.eric.ed.gov (2)The Educator’s Reference Desk,www.eduref.org (3)College Net,www.collegenet.com (4)Peterson,www.petersons.com 3、经济学信息检索工具
(1)EconWPA,http://econwpa.wustl.edu 4、工程技术信息检索工具 (1)Ei Village2,www.ei.org
(2)中国工程技术信息网(CETIN), www.cetin.net.cn
应用:熟悉各种学科资源的检索主要检索工具。
第7章参考信息的网上检索
一、学习目的和要求
通过本章的学习,考生应掌握网上参考信息源的主要类型及相关网站。 二、考核知识点与考核目标
(一)网上参考信息定义和类型(次重点)
批人名、地名、机构、事件、统计数据等一类数据、事实信息,是人们在工作研究和目常生活中经常要查考、引用的信息。
网上参考信息源的主要类型:百科知识检索网站、人物信息检索网站、地理信息检索网站、时事、新闻信息检索服务、机构信息检索网站、语词信息检索网站、统计信息检索网站。
识记:网上参考信息源的类型。
(二)各类型网上参考信息源的代表网站 (一般)
1、不列颠百科全书网站(Encycolpedia Britannica Online),www.britannica.com 2、Marquis Who’s Who, www.marquiswhoswho.com 3、Mapblast,www.mapblast.com 4、Google news, http://news.google.com
5、World of learning online, www.worldoflearning.com 6、Dictionary.com,http://dictionary.reference.com 7、UNESCO Institute for Statistics,www.uis.unesco.org
应用:上网熟悉上述主要参考信息资源网站。
第8章互联网信息检索策略、技巧与提高
一、学习目的和要求
通过本章的学习,考生应了解常用的检索工具;理解信息需求;掌握进阶检索技巧。。
二、考核知识点与考核目标
(一)需求分析(次重点) 1分析检索课题,明确信息需求 2信息需求的描述 3关键词的选取 4关键词的组配 识记:关键词的选取。
(二)检索技巧 (重点) 1判断目标信息可能存在的地方 2了解互联网信息检索的特殊性 3了解可用的检索工具
4仔细分析自己的信息需求并选择合适的工具 5根据检索结果调整检索策略 5进阶检索技巧
应用:选择合适的工具,采用合适的技巧完成检索任务
第9章网络信息检索的未来发展趋势
一、学习目的和要求
通过本章的学习,考生应了解网络信息检索面临的困难以及网络信息检索的发展展望。
二、考核知识点与考核目标
(一)网络信息检索面临的困难与挑战(次重点) 1不断提高的用户需求 2搜索引擎的“瓶颈” 3网络信息检索中的法律风险 掌握:搜索引擎的“瓶颈”。
(二)网络信息检索的发展展望(一般) 1网络信息检索技术 2网络信息检索服务
掌握:网络信息检索服务的发展趋势
正在阅读:
计算机信息检索自考考纲01-17
党课培训的问卷调查06-02
建筑机械概论09-05
概率论与数理统计课后习题答案10-08
魅力方言之咸宁话12-22
毕业设计说明说参考示例204-21
宗教事务法规专场知识竞赛试题07-31
全国计算机等级考试二级VFP重点04-29
年产30万吨煤制甲醇生产工艺毕业设计505-04
美术毕业生实习报告模板03-13
- exercise2
- 铅锌矿详查地质设计 - 图文
- 厨余垃圾、餐厨垃圾堆肥系统设计方案
- 陈明珠开题报告
- 化工原理精选例题
- 政府形象宣传册营销案例
- 小学一至三年级语文阅读专项练习题
- 2014.民诉 期末考试 复习题
- 巅峰智业 - 做好顶层设计对建设城市的重要意义
- (三起)冀教版三年级英语上册Unit4 Lesson24练习题及答案
- 2017年实心轮胎现状及发展趋势分析(目录)
- 基于GIS的农用地定级技术研究定稿
- 2017-2022年中国医疗保健市场调查与市场前景预测报告(目录) - 图文
- 作业
- OFDM技术仿真(MATLAB代码) - 图文
- Android工程师笔试题及答案
- 生命密码联合密码
- 空间地上权若干法律问题探究
- 江苏学业水平测试《机械基础》模拟试题
- 选课走班实施方案
- 考考
- 检索
- 计算机
- 信息
- 北京居住证随往人员变更声明
- 救生(含水上救生)有什么技巧
- 昆虫科目对照表
- 粮油仓储管理办法(2014版)
- 贵州省环保监测站名录2018版153家
- 论信托法与物权法的关系
- 标本液氮冻存处理
- 2014年四年级希望杯培训100题(含答案)资料
- 沥青路面洗刨及修补
- 化湖人家小区共有停车位管理分配方案
- AS400开发入门-By adan
- 我国农村居民生活质量现状与定量分析毕业论文
- 公共事业管理案例 - 图文
- 强军主题教育提纲(贯彻全面从严治党、全面从严治军要求锤炼坚强党性和过硬作风)
- 高三物理第一次模拟考试试题(含答案解析) - 图文
- XX云数据中心安全等级保护建设方案
- 人教版go for it九年级英语 Unit9Section B 1(1a-2e)教案 - 图文
- 中学化学竞赛试题资源库 - 离子晶体
- 2018-2024年中国应用分发市场运营态势研究报告(目录) - 图文
- GB18285-2018重点解读 - 图文