信息检索基本方法教案分析
更新时间:2023-11-15 03:04:01 阅读量: 教育文库 文档下载
- 网络数据库的信息检索教案推荐度:
- 相关推荐
第五章 信息检索的基本方法
5.1 布尔逻辑检索 Boolean logic
由GEORGE BOOLE 1815-1864提出,目前大多数搜索引擎都采用 与 AND, *, & 或 OR, + , ︱ 非 NOT,— , !
逻辑“与”:用关系词AND表示(可写作“*”或“&”)。逻辑“与”表示AND所连接的两个检索词必须同时在结果中出现才满足检索条件。
逻辑“或”:用关系词OR表示(可写作“+”或“︱”),逻辑“或”表示OR所连接的两个检索词只要有一个能出现在结果中就算满足了检索条件。
逻辑“非”:用关系词NOT表示(可写作“and not”“ —”或“!”),逻辑“非”表示NOT后面的那个检索词一定不能在检索结果中出现。
例如: 校庆 AND 武汉大学 高等教育 * 中国 湖南 OR 湖北 移动学习 + 泛在学习 大学 NOT 武汉大学 玉米 – 甜玉米
例如,用GFsoso检索, 电子 AND 读书笔记
电子读书笔记 OR 读书笔记软件
5.2 位置限制检索
临近检索(Proximity Search) 以Dialog为例,收900多个数据库
(1)PRE/0,P/0 表示前后词序不能颠倒,中间不能插入其他词,但可以插入符号。
With, (W)
例如:Wuhan P/0 University
(2)PRE/#,P/# 表示前后词序不能颠倒,中间可插入一定数量的单词,即插入#个单词。
例如:Wuhan P/1 University 检索结果: Wuhan Medical University; Wuhan Agriculture University; Wuhan Technology University;
(3)NEAR/0,N/0 表示前后词序可以颠倒,但中间不能插入单词。 例如: Wuhan N/0 University
检索结果: Wuhan University; Wuhan – University;Wuhan ,University University, Wuhan; University-Wuhan; University Wuhan (4)NEAR/#,N/# 表示前后词序可以颠倒,中间可以插入#个单词。
例如: Wuhan N/1 University 检索结果: Wuhan Medical University; Wuhan Agriculture University; Wuhan Technology University;
University of Wuhan; University in Wuhan; University at Wuhan
(5)(s)是sentence的缩写,A(s)B表示A和B必须同时出现在记录的同一个句子或短语中,但次序可以随意改变,A与B之间可以有若干个其他的词。
如:resin (s) ester (酯化树脂)
【练习】1、查找computer和game的间隔不大于100个单词的网页
2、检索“杂交玉米”的外文文献,要求两词间隔1个词,前后次序固定。
hybrid、corn
答案:1、computer near/100 game
2、hybrid p/1 corn hybrid w/1 corn
5.3 短语检索(精确检索)(Phrase Search Exact Search) 一般用“”表示。常见类型:
(1)机构名称检索:“Wuhan University”
“The World Intellectual Property Organization” (2)人名检索: 如“George W. Washington”
否则可能出现:George W. Bush spoke at Washington D.C about human rights (3)用于专有名称检索:如 “information retrieval” “sleepless in seattle”电影名
电子读书笔记 与 “电子读书笔记”的检索结果是不同的
5.4 截词检索(Truncation Wildcat)
是指在检索式中用专门的截词符号(一般用* 表示)表示检索词中的某一部分允许有一定的词形的变化。因此,检索词的不变部分加上由截词符号所代表的任何变化形式所构成的词汇都是合法检索词。
截词符号可以用*,?,位置可分左截断、右截断、中间截断、左右截断 (1)左截断:*physics可检索出physics, bio physics, chemophysics, geo physics等。
*ology →Biology, geology, zoology *ism, *graphy
(2)右截断:Comput*可检索出Comput, Computing,Computer,Computerized等。
econom*,→economy; economic; economics; economical; economist; economize; ……
(3)中间截断wom*n 一个?代表一个字符,结果是woman, women (4)左右截断*toxic* →cytotoxic; neurotoxicities; hepatoxicologic;…
表5-1 世界上主要数据库截词算符 数据库 MEDLINE MEDLINE,SCI 平台 PubMed WOS 1个字符 ? ? ? * ? 多个字符 * * * ? * ! * 0或1个字符 $ # MEDLINE,CSA ProQuest Agricola EBSCO Lexis-Nexis SDOL,Springer
5.5字段限制检索(Field Limiting)
通过对检索词出现的位置进行限定,以实现精确检索。
例如:中国有多少政府网站? 无固定答案,因该题是一个动态变化的过程。 网站的构成规律,斜杠越多,层次越多。
例如:http://www.sim.whu.edu.cn/teacher/teach-info.php cn 国家或地区代码,美国没有us
edu 机构类型代码,如gov表示政府机构;org表示非盈利机构;com表示商业性机构
whu 表示机构名称
sim表示某机构下面的子机构,此处代表School of Information Management (1)网址字段:URL: Uniform Resource Locator
例如: url:gov.cn 结果有多少个记录,就有多少个政府网站 (2)题名字段: title(ti): Wuhan University
(3)出版字段:PY >=2010 (PY=Publication Year) (4)语种字段:la = english
(5)链接字段:link: whitehouse.gov (link用来查找链接到某个网站的所有的网页,如果某人有自己的博客或主页,通过这种方法可以看到它被链接的情况,从而了解到本人的知名度。此外,用link还可以查看其它网站的链接情况) (6)多字段组合检索
例如: admission AND site: www.harvard.edu (site表示检索结果要限制在后面这个网址当中,即只能从这个网站去找资料。上式表示从哈佛大学的官网中找入学的资料)
例如:au = wang li AND (CS=Wuhan Univ.) (CS=corporate source) 例如:比较下三个检索式检索结果的不同之处 ① “information retrieval”/TI ② information AND retrieval /TI
③ information (F)retrieval (F=field)
检索结果中,第3个最多,第1个最少。第一个结果表示在题名字段中检索,并且必须与输入的形式完全相同;第二个表示在题名字段中检索,但不严格限制是短语,如“information organization methods for effective retrieval”; 第三个表示只需要在同一个字段中即可。
5.6 区分大小写检索(Case-Sensitive) China 中国;china 瓷器
Apple苹果公司(产品);apple苹果 Windows windows操作系统; windows窗户 Jobs 乔布斯; job 工作 Web万维网、web蜘蛛网
例如:国家图书馆联机公共目录查询系统中的“多字段检索”采用的就是字段检索;
Metacrawler的高级检索等。
5.7 多语种检索方法的综合运用(Integrating Different Search Methods)
表达一个概念的词有很多,如移动学习、数字学习、泛在学习;信息素质、信息素养、咨询素养等,因此在构造检索式时要充分考虑每个检索词的不同表达形式,尽量不要遗漏,最好的方法是采用积木型检索式构造方法。
例1:查找与电子图书标准化有关的文献
(“电子图书” OR “电子书” OR “数字图书” OR “在线图书” OR “线上图书” )AND (“标准化” OR 标准 OR 规范)
上述的问题若换成英文检索,其中标准的表达是standard; standards; standardize; standardizing; standardization; standardizations等,很麻烦,可以考虑用截词符号代替,即standard*,上述检索式可转换为:
(e-book OR “electronic book” OR “digital book” OR “online book” )AND (standard* OR specification)
例2:查2009年出版或发行的关于克隆人立法方面的英文著作或论文 中文检索式: PY=2009 AND 克隆人 AND (立法 OR 法律 OR 法规) AND LA=English AND (DT=book OR article)
英文检索式:PY=2009 AND “human cloning” AND (law OR laws OR legislat* OR rule) AND LA=English AND (DT=book OR article)
注:上例中用legislat*代替了legeslate; legislating; legislated; legislation; legislations…..但用截词检索时要慎重,要避免不必要的词出现,如law,如果用law*检索,则会出现lawyer律师,lawsuit
思考题:试列举百度、谷歌的高级检索指引。
(“电子图书” OR “电子书” OR “数字图书” OR “在线图书” OR “线上图书” )AND (“标准化” OR 标准 OR 规范)
上述的问题若换成英文检索,其中标准的表达是standard; standards; standardize; standardizing; standardization; standardizations等,很麻烦,可以考虑用截词符号代替,即standard*,上述检索式可转换为:
(e-book OR “electronic book” OR “digital book” OR “online book” )AND (standard* OR specification)
例2:查2009年出版或发行的关于克隆人立法方面的英文著作或论文 中文检索式: PY=2009 AND 克隆人 AND (立法 OR 法律 OR 法规) AND LA=English AND (DT=book OR article)
英文检索式:PY=2009 AND “human cloning” AND (law OR laws OR legislat* OR rule) AND LA=English AND (DT=book OR article)
注:上例中用legislat*代替了legeslate; legislating; legislated; legislation; legislations…..但用截词检索时要慎重,要避免不必要的词出现,如law,如果用law*检索,则会出现lawyer律师,lawsuit
思考题:试列举百度、谷歌的高级检索指引。
正在阅读:
信息检索基本方法教案分析11-15
科技部关于印发《专业化众创空间建设工作指引》及公布首批国家专业化众创空间示范名单的通知12-16
起重机械伤害事故事故应急预案08-26
2018年超星尔雅大学生创业基础李肖鸣课后答案大全08-19
第五章 企业战略管理07-29
砂的筛分析试验报告04-09
广东省江门市2017届高考物理一轮复习模拟试题:法拉第电磁感应定律 含解析12-02
奉贤滚灯的历史由来和传承现状 -10-04
- exercise2
- 铅锌矿详查地质设计 - 图文
- 厨余垃圾、餐厨垃圾堆肥系统设计方案
- 陈明珠开题报告
- 化工原理精选例题
- 政府形象宣传册营销案例
- 小学一至三年级语文阅读专项练习题
- 2014.民诉 期末考试 复习题
- 巅峰智业 - 做好顶层设计对建设城市的重要意义
- (三起)冀教版三年级英语上册Unit4 Lesson24练习题及答案
- 2017年实心轮胎现状及发展趋势分析(目录)
- 基于GIS的农用地定级技术研究定稿
- 2017-2022年中国医疗保健市场调查与市场前景预测报告(目录) - 图文
- 作业
- OFDM技术仿真(MATLAB代码) - 图文
- Android工程师笔试题及答案
- 生命密码联合密码
- 空间地上权若干法律问题探究
- 江苏学业水平测试《机械基础》模拟试题
- 选课走班实施方案
- 教案
- 检索
- 基本
- 方法
- 分析
- 信息
- 《清明节,缅怀先烈》六年三班主题班会
- 2016尔雅通识课《幸福心理学》课后作业答案
- 广西海上客船安全监督管理规定(试行)
- 烟气流量
- 2019八年级数学上册第2章特殊三角形2.8直角三角形全等的判定练习(新版)浙教版
- 两票(工作票、操作票)管理制度
- 化学兴趣小组活动记录
- 管理系统中计算机应用试题 - 图文
- 单片机程序源代码
- C语言-数组程序设计
- 路政第三大队清明期间工作小结
- 高级财务会计--第三章合并会计报表习题答案
- 项目建设攻坚年实施方案
- 座椅设计及人机工程学分析 - 图文
- 潍坊学院团字200933号
- 500题应用文作文答案(旧版)
- 详细讲述关于网站SEO工作中首页优化的心得体会
- 七年级下册英语:Unit1单元检测试卷(含答案)
- 基于流程银行模式PJ商业银行绩效评价研究
- 极端天气及路况告知制度