医学文献检索理论

更新时间:2024-06-26 08:07:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

信息:是客观世界中各种事物的变化和特征的最新反映以及经过传递后的再现。 知识:系统化,理论化的信息。

知识是人类对客观事物的认识、实践经验的总结。

知识是一种特定的人类信息,它是对信息进行提炼和深化的结果。 信息是知识的源泉、材料,知识是信息的理论和结果。

情报:人在一定的时间内为一定目的而传递的有使用价值的知识或信息。情报来源于知识,是知识的一部分,是特定的知识或信息。 具有保密性、时效性、传递性 文献:记录有知识的一切载体。

凡人类的知识或信息,以文字、图形、代码、符号、声频、视频等形式记载到不同固态物质载体上面形成的一切记录。 l 文献由四要素构成:

l 文献信息:文献的内容。指文献载体上所承载的信息、知识内容。它属于信息, 除具有信息的一切性质和功能外,也有自身的特点。

l 符号系统:信息的携带者。文献的符号系统指图画、文字、公式、图表、编码、 声像和电磁信息等。

l 文献载体:符号赖以依附的“寄主”

l 记录方式:代表文献的符号进入载体的方法和过程。文献的记录方式是指表达 信息的符号系统通过特定的人工记录方式使其附着于一定的文献载体上。 l 四要素缺一不可。

4者关系:信息升华到理论化和系统化就形成了知识,再将知识记录在一定的物质载体上就形成了文献。文献是贮存传递知识、情报和信息的介质。知识是文献的实质内容,载体是文献的外在形式。 信息>知识>情报

l 医学文献特点: 1. 数量庞大2. 载体多样化3. 多种文化4. 学科交叉、出版分散、 5. 知识信息更新加快6. 交流传播速度加快7. 电子化发展趋势

文献检索:将文献按照一定方式集中组织和存储起来,并按照文献用户需求查找出有关文献或文献中包含的信息内容的过程。

包括文献存储和检索(广义)。狭义的文献检索是从用户的角度来理解,仅指从已经存贮的具有检索功能的文献信息集合中查询出所需文献的过程。 类型:(1)按检出结果形式划分:书目检索、全文检索、引文检索。

(2)从情报检索角度划分:文献检索、数据检索、事实检索 (3)按检索手段划分:手工检索和计算机检索 原理:(关键) 标识与存贮标识相一致

(存储中,对外表特征(标题、作者、来源、卷期、页次、年月、类型、号码、文种)和内容特征(主题词、分类号、类型名称、文摘)分析和加工,形成文献特征的标识,排序形成多种索引编入到检索系统)

分类标引:对文献赋予分类号标识的过程 主题标引: 主题词标识

字段:每一种文献特征。Field:组成记录的数据,反映一篇文献的具体特征。如题名(TI)、著者(AU)、地址(AD)、出处(SO)、主题词(MeSH)、关键词(KW)、特征词(TG)

出版年(PY)、语种(LA)

“缺省”字段由标题、摘要、关键词、主题词、作者、刊名组合而成。“出处”为组合字段 记录(Record): 是构成数据库的基本信息单元,每条记录都描述了一个原始信息的外表和内容特征。一条记录通常由多个数据项组成,文献型数据库中的一条记录通常代表一篇文献。 文档(File): 是数据库中一部分记录的集合。许多大型数据库往往包含有数以万计的记录,为便利用户检索,常划分为若干文档。 数据库>文档>记录>字段

文献检索系统:指根据特定的文献信息需求而建立起来的一种有关文献信息的搜集、加工、存储和检索的程序化系统。

类型:目录型、题录型、文摘型、全文型 文献检索系统的评价:(1)报道信息的准确性 (2)报道信息的及时性 (3)索引体系的完善程度 (4)对信息标引的深度 (5)查全率和查准率 查全率与查准率

查全率(R)和查准率(P)是检索系统最为流行和重要的两个性能和效果评价标志。 R=检出的相关信息量/检索工具中相关信息总量X100% P=检出的相关信息量/检出的信息总量X100%

P和R之间存在互逆关系,如果R较高,P将相对下降;反之亦然。两者只能相对提高,两者永远不可能达到100%

一次文献信息(原始文献):是指以著者本人的研究成果(如实验、观察、调查研究等结果)为依据而创作的原始文献,如期刊论文、专利说明书、会议论文、学位论文、科技报告等。

特点:内容新颖、详尽,因而是文献信息的最主要来源和检索对象,但其量大、分散而无序,对其查找与利用带来不便。

二次文献信息:是对大量的、分散的、无序的一次文献信息经过加工整序后而形成的文献。如目录、索引和文摘等。

特点:报道性和检索性,主要作用是提供查找文献信息的线索,故又称为检索工具。 三次文献信息:是将分散无序的某一范围的一次文献,经过综合整理后而重新组织成有条理有定评的文献,如综述、进展、年鉴和百科全书等。

特点:对知识信息具有浓缩性和综合性的特点,同时兼有检索文献的作用。

零次文献信息:是指未经正式发表或未融入正式交流渠道的最原始的文献,如书信、手稿、实验数据、观察记录、笔记、内部档案等。 特点:内容新颖,但不成熟,难以查询。

零次文献是形成一次文献最基本的素材;一次文献是信息的主要来源和检索对象;二次文献是检索的手段和工具;三次文献既是检索对象,同时也具有检索文献之功能。 电子文献资源的特点:(1)存储介质和传播形式的改变(2)信息的表现形式多样化 (3)文献资源类型多样化(4)多层次的信息服务功能(5)更新速度快、时效性强(6)具备检索系统或功能(7)检索访问不受时空限制 数据库:参考数据库:书目数据库、指南数据库

源数据库:全文数据库、事实数据库、数值数据库、术语数据库、图像数据库 混合数据库

检索语言:又称标引语言或索引语言,是用于描述文献检索系统中文献的内容特征及外表特征和表达用户检索提问一种专门的标识系统。

检索语言由检索标目(检索系统中的特征标识,也称检索词、索引词、标引词等)和语法组成(利用标目查找文献的一整套规则)。 分类:1、规范语言:又称受控语言、人工语言

2、非规范语言:又称非受控语言、自然语言。(自由词、关键词。无法用规范词准确表达或新出现的词语)

《中图法》将学科划分为5个基本部类(马克思主义、列宁主义、毛泽东思想;哲学;社会科学;自然科学;综合性图书),22个基本大类

主题检索语言:以反映文献内容的主题词或关键词作为文献存储和检索的标识。

关键词语言:有意义的信息。易于掌握、灵活性高、词汇更新及时;缺乏词汇控制,用词不统一、检索率偏低

叙词语言(主题词):概念组配,组配性。结构完备、词汇控制严格、组配准确;增加了标引和检索难度

先组式语言:分类语言、标题语言等

后组式语言:叙词语言、单元词语言(规范)、关键词语言(非规范)等 《医学主题词表》(MeSh):副主题词又称限定词,与主题词进行组配

代码检索语言:用代表事物的代码作为标识系统的索引语言。(化合物分子式索引、环状化合物环系索引、化学物质号索引等)

文献检索的方法:(1)追溯法: 通过已知文献后附有的参考文献中提供的线索来查找文献。 (2)常用法:利用各种检索工具来查找文献。它又分为顺查法、倒查法和抽查法。 (3)循环法:是将常用法和追溯法交替使用的一种综合文献检索方法。 (4)浏览法:是从本专业期刊或其它类型的原始文献中直接查阅文献资料。

l 顺查法:按照时间顺序由远及近逐年查找文献的方法。一般用于重大课题和各学科 发展史以及新兴学科等方面的研究课题的全面检索,一般已知课题开始年代。如查找“有关SARS的文献” 。查新规定检索十年或十五年的文献

l 倒查法: 按照时间顺序由近及远回溯性逐年查找文献的方法。科研人员常用的检索方法。适用于一些新课题或有新内容的老课题,或在确认某项成果是否有创新时,也适合采用倒查法

l 抽查法:针对某学科或某课题研究的特点,根据文献资料发表集中的年代或时期,抽出其中一段时间进行文献检索的方法。多用于写专题调查报告。

检索途径:(1)著者途径:利用已知著者姓名作为检索标识进行文献查检。

(2)分类途径:利用特定分类体系的分类号或分类类目作为检索标识进行文献查检。 (3)主题途径:利用从文献中抽出来的、或经过人工规范化的、能代表文献组要内容的检索标识或标引词进行检索。

(4)其他途径:利用特定的检索标识进行文献查检。 布尔逻辑运算符的优先顺序:()>NOT>AND>OR 检索词之间可直接使用逻辑运算符,但智能检索除外。 位置算符:with表示同字段检索 字段限定符:如AIDS in ti;py=2002

截词算符:“*”、“?”

中国生物医学文献数据库 (CBM)

数据标引:CBM的全部题录均根据《医学主题词表》(即MeSH词表)、《中国中医药学主题词表》进行主题标引,《中国图书馆分类法 · 医学专业分类表》进行分类标引。 通配符:(1)单字通配符?:替代一个字符。注意:?必须为半角状态。 (2)任意通配符%:替代任意个字符。

强制执行符/短语检索符“”:检索词做为短语或含有特殊符号“-”、“(”、“,”等,用英文半角双引号标识检索词,如: “1,25-(OH)2D3” CBM检索方法:

1、基本检索:也称自由词检索或关键词检索。(CBM默认)

优点:没有严格的词语规范,根据个人需要使用不同的自由词,检索时灵活、方便、直观,尤其是专有名词、新名词

缺点:检索误差大,查准率、查全率不高

(精确检索:检索结果等同于检索词的一种检索,适用于关键词、主题词、特征词、分类号、作者、第一作者、刊名、期字段。如第一作者=马明)

2、主题检索:是基于文献内容的主题概念进行检索,有利于查全率和查准率。 优点:利于查全和查准

便于扩大或缩小检索范围(扩展vs不扩展、加权 vs 不加权) 便于限定文献的主要概念及各个方面(组配一个或多个副主题词) 缺点: 非专业人员难以掌握主题词的标引

主题词:亦称叙词,是指能代表文献主题内容实质的、经过严格规范化处理的专业名词术语。 (词条中带有“见”字时,前面的词为主题词的同义词,后面的词为正式主题词) 主题词加权检索:加权检索(缩小范围,提高查准率)表示仅对加*主题词检索; 非加权检索(增大范围)表示对加*和非加*均进行检索 。

主题词/副主题词扩展检索:上位只有1个,下位可有多个。有“+”表示有下位。 扩展检索(增大范围),非扩展检索(缩小范围)

副主题词的选择:阿司匹林(药名:治疗应用)治疗高血压(疾病:药物疗法) 碎石术(方法)治疗尿路结石(外科学)

3、分类检索:是指按学科或专业去收集文献,采取的是族性检索方式,如果对某一课题做比较全面的文献收集和积累或已经知道所需文献的学科分类体系,就可以从分类途径进行查找。

4、期刊检索:指对已收录到CBM检索系统中的期刊进行检索。期刊表列出了数据库中收录期刊名称及其有关信息。 5、作者检索

6、限定检索:把年代、文献类型、研究对象等常用的限定条件整合到一个对话框,方便检索。

检索结果显示和保存:

排列方式:年代、作者、期刊、相关度

输出方式:打印(单次最多500)、保存(500)、E-mail(50) 显示格式:

(1)题录格式(系统默认):标题、作者、作者单位、出处。

(2)文摘格式:标题、作者、作者单位、文摘、出处、关键词、主题词、特征词。 (3)详细格式:显示全部字段。在文摘格式基础上增加了参考文献、资助类别等。 PubMed数据库

http://www.ncbi.nlm.nih.gov/PubMed

PubMed:美国NLM所属的国家生物技术信息中心(NCBI)开发的一个以Web方式向用户提

供服务的生物医学文献检索系统,是目前世界上查找医学文献利用率最高的网上 免费数据库 特点:

| 获取生物医学权威期刊最多

世界上70多个国家的7395种权威期刊 | 多种检索方法,多条检索途径 | 时效性极强(每周更新) | 回溯年代久远(1950年至今) | 利用MeSH作为转换词表,标引质量高 | 部分文献可以免费获取全文 | 检全率、检准率高

PubMed的数据范围(子库) :

(1) MEDLINE 收录范围:来源于美国和世界上70多个国家和地区、50种语言的7395种(截止到现在)权威生物医学及相关学科期刊,内容涉及生物医学各个领域;85%以上原文为英语,80%±记录有文摘,5%免费全文。目前记录已达约1900万条,约40万篇/年 。 回溯时间:1966年至今。 记录中有[indexed for MEDLIEN]标记 (2) OLDMEDLINE(1950-1965)

(3) PreMedline 是一种由正在加工处理中的文献记录组成的数据库,这些新记录还未被或正在标引,暂时存放在PreMEDLINE数据库中。每天更新,经过标引(增加主题词、文献类型、数据库存取号等字段)以后转入Medline,一旦记录被转入到Medline数据库,就被从PreMEDLINE数据库中删除。记录中有[PubMed-in process]的标记。

(4) 出版商提供的书目信息:出版商直接向PubMed提供的非Medline收录的电子刊物,记录标有[Record as supplied by publishers]标记。

(1)布尔逻辑运算符:运算顺序:OR

(3)利用字段标识符进行限定检索:

检索式格式:检索词A[字段标识B],检索在字段中含有检索词A的文献。 如: hepatitis[TI],smith [AU],cell[TA]。

(4)“ ”,将短语做为不可分割的整体进行检索。 如:“OXYGEN FREE RADICALS ” 注意:AND 必须大写、[ ]和“ ”必须为英文或中文半角。

标识符及检索字段:ALL(所有字段)、AU(作者)、DP(出版日期)、LAU(第一作者)、LA(语种)、LASTAU(最后一位作者)、PI(出版国家)、PMID(PubMed唯一标识码)、PT(文章出版类型)、SB(子集)、TA(期刊全称)、TI(文章英文标题)、TIAB(题目/文摘)TW(自由文本词)、VI(期刊卷)、IP(出处)、MAJR(加权词)、SH(副主题词)、NM(物质名解) PubMed的检索途径和方法 (1) 基本检索

PUBMED的词汇自动转换功能(顺序):

MeSH转换表 期刊转换表 短语表 作者姓名索引 逻辑运算符检索 (作者检索:姓在前,名在后,姓全称,名缩写)

(2) 高级检索:限定检索条件,Limits (8个方面的限定): All Field:共有30个字段可供选择;Publication Types:有7种类型

Languages:提供常用的7种语种;Ages:共有13个年龄段

Gender:男性、女性;Human or Animal;Subsets(子集):11个主要子集 Dates:可检索1965年至今的文献

(3) 主题检索Pubmed主题词检索的功能:

(1)理解词义和收入词表的时间(2)限定副主题词 ,提高查准率 (3)加权检索,提高查准率。(4)了解树形结构,扩展检索,提高查全率 (5)了解同义词,提高查全率。 (4) 期刊检索 (5) 专用检索

选择“File”,可完成将记录保存为文件;剪切板(clipboard)静止状态下最长保存8 小时,最多可以保存500条记录 中文期刊全文数据库

中国知识基础设施工程(CNKI),是我国第一个大规模集成化的全文电子学术期刊系统。由 清华大学、清华同方发起,是以实现全社会知识资源共享与增值利用为目标的信息化建设 项目,1999年6月起在网上运行。

中国期刊全文数据库 (CJFD) 是中国国家基础设施工程CNKI的重要组成部分,是目前世界上最大的连续动态更新的中国期刊全文数据库。全文文献总量3252万多篇。产品分为十大专辑:包括理工A、理工B、理工C、农业、医药卫生、文史哲、政治军事与法律、教育与社会科学综合 、电子技术与信息科学、经济与管理。十专辑下共分为168个专题数据库。产品形式:WEB版、镜像站版、光盘版。 检索途径与方式:

1.初级检索:“主题”检索字段:篇名、关键词、摘要内进行检索。

2.高级检索:可以同时对多个检索项进行限制,并对多个检索项进行逻辑组配,即多项双词逻辑组合检索,同时还可以分别进行词频控制、词扩展。

通讯作者:一般为该工作的“组织者”,即“老板”。而第一作者为对该工作做出最大贡献者。国外看文章一般看通讯作者。

3.专业检索:适用于熟练掌握检索的专业检索人员。所有符号和英文字母,都必须使用英文半角字符

4.期刊导航:专辑导航、数据库刊源、刊期、地区、主办单位 、发行系统、期刊荣誉榜、世纪期刊、核心期刊、中国高校科技精品期刊 爱思唯尔ELSEVIER

SD(www.sciencedirect.com)

SD特点:期刊数量多,学科覆盖广,2200多种期刊,24个学科领域;完全的全文数据库,实时更新;PDF格式,及时获取在编文章;回溯时间长,Lancet回溯至1823年创刊号,中国大多数用户都订购了1995年以来的全文;IP控制,无并发用户限制;功能强大,易学易用;更少的点击,更智能的检索(FAST引擎),多种个性化工具。

临近度算符 W/n PRE/n “ ” ? ?{} ( ) 作者检索

Or>W/n | PRE/n >And>Not 两种临近符不能同时使用

两词相隔不超过n个词,词序(前后顺序)不定 两词相隔不超过n个词,词序一定

宽松短语检索,标点符号、连字符、停用字等会被自动忽略 精确短语检索,所有符号都将被作为检索词进行严格匹配 定义检测词顺序,例:(remote OR satellite) AND education

先输入名的全称或缩写,然后输入姓,例: r smith ; jianhua zhang 临近符可以用于作者检索,raymond W/3 Smith 可检索到 Raymond Smith, Raymond J Smith and Smith Raymond J. 增加“Specific author”字段,作者检索更加准确

支持希拉字母α, β, γ, Ω检索;

如文章中有中文、日文等语言,可直接用相应语言检索; 法语、德语中的重音、变音 符号,如é, è, ? 均可以检索。

检索方法:Browse (浏览检索)、Quick Search(快速检索)、Advanced Search(高级检索) Expert Search(专家检索) 字段名和布尔逻辑符均不区分大小写

字段名既可以用字段全称,也可以用简写编码

个性化功能:1、自动保存的最近操作(检索,全文下载,期刊浏览 ) 2、站外和站内速

链接3、期刊收藏(收藏列表,卷期提示,限定检索浏览范围)4、检索历史 维普数据库 www.cqvip.com

中文科技期刊数据库:发行:重庆维普资讯有限公司---国家科学技术部信息中心下属的一家大型的专业化数据公司。类型:期刊全文数据库。按照《中国图书馆分类法》进行分类。 收录范围:年限:1989年至今

? 数据量:12000多种期刊,总计1650余万篇文献,年增长250余万篇。

? 学科:涵盖理、工、农、医、文、史、哲、法各个领域,所有文献被分为社会科学、自然科学、工程技术、农业科学、医药卫生、经济管理、教育科学和图书情报8大专辑 逻辑运算符:“与”(AND、* )、“或”(OR、+ )、逻辑“非”(NOT、- )

注意:检索过程中,如果检索词中带有括号或逻辑运算符*、+、- 、()、《》等特殊字符,必须在该检索词上用双引号括起来,以免与检索逻辑规则冲突。 检索途径:1.快速检索 2.传统检索 3.高级检索 4.期刊导航

特点:1、可以直接浏览全文2、关键词途径检索时,可以查找同义词 3、著者途径查找时,可以查找同名著者4、分类检索 网络信息检索

搜索引擎:泛指因特网上提供网页信息资源检索和网站导航服务的站点,实质是一种网页或网址检索系统。主要面向互联网信息检索,通常又称网络检索工具。它可以收集大量互联网信息并按一定的方式组织和编排,为用户在信息海洋中便捷、高效地查找信息资源提供了方便。

搜索引擎组成:搜索软件 索引软件 检索软件

Search Engine: 指运行在因特网/内联网(Internet/Intranet)上,以因特网/内联网上的各种信息为对象,以信息检索的方式提供用户所需信息的一种数据库服务系统。

按检索功能分:1、主题分类指南式搜索引擎(优点是范围集中,检准率较高。缺点是人工分类影响了信息的全面性,分类比较随意,层次少,更新速度也不够及时) 2、关键词式搜索引擎

按检索范围分:1、独立搜索引擎2、集成搜索引擎3、引擎之引擎http://www.265.com/ 按检索内容分:

1、综合搜索引擎:指收录的信息涉及多个主题及多种信息类型,因此,利用它可以查找到几乎任何方面的信息,如Google(谷歌)(拥有56种语言支持40多种语言检索)、百度、搜狐和新浪等。它往往基于检索词去匹配相关的内容,所以信息量大,时常会因检出内容太泛而无法一一过目,影响了查准率。

2、专业搜索:指专门查找某一学科专业信息的搜索引擎。其共同特点是,分类类目较细,专业化程度高

3、专题搜索引擎:指专门收录某一专题信息的搜索引擎。如天气预报网、 旅游网、导购网、中国眼科医生网等等。专业针对性较强,查准率较高。

Google特色 :(1)可使用150种语言(2)速度极快,0.5秒内即可(3)使用网页级别技术(PageRank)与超文本匹配分析,客观评价各网页的重要性。在综合考虑整体重要性及特定查询的相关性之后,Google将最相关最可靠的搜索结果放在首位。(4)提供与原搜索提问相关的检索词。(5)定位检索功能:点击智能化的“手气不错”按钮,会直接进入最

符合搜索条件的网站,省时又方便。(6)“类似结果”功能(7)“网页快照”功能(8)Google学术搜索

1. 中国生物医学文献数据库(CBM):(图书馆)

优先级:NOT > AND> OR

截词:单字通配符(?) 任意通配符(%) 2. PubMed数据库: http://pubmed.gov

AB 摘要

AD 第一作者机构地址 AU 作者

DP 文章出版日期 1AU 第一作者 FAU 作者全称 MH 主题词 TI 标题

TW 自由文本词 无优先级 截词符: *

字段标示符: 【】

作者检索: 格式 :“著者姓 空格 名字首字母缩写如:smith ja[AU]

”3. 中国期刊全文数据库(CNKI):(图书馆)

(SDOL)Sciencedirect: http://www.sciencedirect.com

(爱思维尔)

优先级: OR > AND > AND NOT 邻近度算符: W/n , PRE/n 通配符: * , ?

作者检索:格式:先输入名的全称或缩写,然后输入姓 如:y shang

限定specific author 字段,检索词必须出现在同一个

人得名字中

5. 维普:(图书馆)http://www.cqvip.com

逻辑运算符:* 并且 + 或者

- 不包含

6.万方:(图书馆) wanfangdata.com.cn 7. google

逻辑运算 : + 空格 与(AND) OR 或

- 非

(注意:-前要空格,后面不空格 如:情流感 –动物)

限定检索:加“:” 如: site: filetype: 如:护理学filetype:PPT

例题:

用主题检索查找:胆囊切除术(MT方法)治疗胆囊癌(外科学SU)的文献。

用主题检索查找:利用尼莫地平(Nimodipine)治疗脑出血 (Cerebral Hemorrhage)的英文文献。

治疗应用 threpy use 药物治疗 drug threpy

本文来源:https://www.bwwdw.com/article/zyb3.html

Top