Pubmed检索-讲稿
更新时间:2023-10-15 14:10:01 阅读量: 综合文库 文档下载
PubMed检索
内容:
PubMed及NCBI相关数据库 PubMed数据范围 认识PubMed PubMed检索方法 PubMed RSS学科跟踪 PubMed及相关数据库
NCBI(National Center for Biotechnology Information,美国国立生物技术信息中心)
NCBI是目前国际上几个重要分子生物信息网站之一,其成立的原因是为已故的参议院议员Claude Pepper发现计算信息处理方法对生物医学研究的重要性,因此,在1988年11月4日成立NCBI。NCBI是National Institutes of Health(NIH)底下的National Library of Medicine(NLM)的部门之一。由于NLM具有建立与维护生物医学数据库经验,且因它是NIH的单位,因此可执行计算分子生物计划。NIH目前是全世界最大的生物医学研究单位。 NCBI成立的主要任务为:
(1)提供生物医学的分析与计算工具,协助研究人员了解生物的语言--DNA在健康与疾病中所扮演的角色
(1)发展新技术协助了解调控健康与疾病的基本分子与遗传过程, 包括建立储存与分析分子生物、生化与遗传学知识的自动系统;促 进研究与医学社群使用数据库与软件;协调生物技术信息的传递与 管理;执行以计算机为基础的进阶信息分析过程,用以分析生物重要分子的结构与功能。 NCBI组织架构:
Computational Biology Branch (CBB) Information Engineering Branch(IEB) Information Resources Branch(IRB) Computational Biology Branch(CBB)
处理运算、数学及分子生物、生物与遗传学理论问题的基础与应用研究,包
1
括基因体分析、序列比对、序列搜寻方法、巨分子结构、动力学与交互作用、结构/功能预测等。
建立NIH实验室、政府机构、学术单位与产业界之生物学家、化学家、数学家与计算机科学家间的计算分子生物合作研究计划。
提供研究分子生物分析工具的咨询与建议。
与分子生物社群互动,利用计算与理论方法提高实验研究质量。 Information Engineering Branch(IEB)
进行数据表现与分析的应用研究,包括在分子生物、遗传学与生物化学的计算机储存、管理与检索系统。
设计各种呈现分子生物信息的数据库架构与规格书,包括核酸、蛋白质与结构信息。
设计与发展分布式软件系统,提供研究人员本机与远程的计算服务。 协调公开序列、遗传、结构、目录信息,建立管理与整合数据库或连结至外部数据库。
建立NIH内部与外部学术单位的信息学合作研究计划。 提供软件与数据库设计咨询与建议。
发展与提倡数据库、数据交换与生物命名的标准。 Information Resources Branch(IRB)
计划、监督与管理NCBI的计算机技术操作,包含用来研究、发展与存取公开数据库的计算机系统。
提供NCBI人员与外来使用者技术支持。 提供NCBI服务之网络操作指导。 规划使用NCBI资源的教育训练与研讨会。
计划、发展与管理政府合约与合作协议书,已获得支持NCBI信息 功能的设备与服务。
作为基因体计划使用者与服务办事处之联络人。
执行应用研究与发展,提供技术支持与指导,鉴定使用者需求; 管理生物使用社群之问卷调查,以评估NCBI发展的软件使用情形。 协调政府其它办事处与生物信息资源,促进NCBI数据储存的发展。
2
NCBI还有一个跨多学科的基础研究群,组成人员包括计算机科学家、分子生物学家、数学家、生化学家与物理学家,共同致力于计算分子生物的基础与应用研究。他们一起研究利用数学与计算机方法解决分子层面的基本生物医学问题,这些问题包含了基因结构侦测与分析、序列分析、立体结构预测、重复序列类型(Pattern)、建立基因体图谱、HIV感染动力学的数学模型、分析序列错误对数据库搜寻的影响、发展数据库搜寻与多重序列比对的新算法、建立无重复的序列数据库、使用数学模型评估序列相似性在统计学上的重要性、建立文章检索的载体(Vector)模型等。除此之外,这些研究人员尚与NIH的研究单位、学术单位的研究实验室与政府机构的研究实验室间维持合作关系,目前仍有多项研究计划正在进行当中。 NCBI资源
NCBI目前提供的生物信息资源主要分为: (1)生物数据库 (2)生物信息工具 生物数据库
生物数据库是一个永久数据的大的组织体,通常结合计算机软件执行更新、查询与存取数据的功能。对于研究人员而言,数据库必须符合:容易取得信息以及只取得回答特殊生物问题的信息两项功能。
NCBI的数据库搜寻与存取系统-Entrez,可用来获取单一数据库或许多数据库的整合数据。例如Entrez蛋白质数据库除了可查询蛋白质信息,同时亦可连结到生物分类数据库查询生物分类信息。目前,NCBI提供的公开(Open Access)数
据库包括如下:
3
Entrez以及BLAST
Entrez是NCBI的为用户提供整合的访问序列,定位,分类,和结构数据的搜索和检索系统。Entrez同时也提供序列和染色体图谱的图形视图。Entrez是一个用以整合NCBI数据库中信息的搜寻和检索工具。这些数据库包括核酸序列,蛋白序列,大分子结构,全基因组,和通过PubMed检索的MEDLINE。Entrez的一个强大和独特的特点是检索相关的序列,结构和参考文献的能力。PubMed是一个网络搜索界面,可以提供对在MEDLINE上的九百万杂志引用的访问,包含了链接到参与的出版商网络站点的全文文章。
BLAST是一个NCBI开发的序列相似搜索程序,还可作为鉴别基因和遗传特点的手段。BLAST能够在小于15秒的时间内对整个DNA数据库执行序列搜索。NCBI提供的附加的软件工具有:开放阅读框寻觅器(ORF Finder),电子PCR,和序列提交工具,Sequin和BankIt。所有的NCBI数据库和软件工具可以从HTTP或FTP来获得。 Entrez可以检索的数据库
Books 出版社提供之数字生医图书与医生参考书籍数据库
Cancer Chromosomes 美国国立癌症研究所的Mitelman Database of Chromosome Aberrations in Cancer数据库里已经整合好的cytogenetic、临床与文献相关数据
Conserved Domain Database(CDD),蛋白质功能区块保留序列数据库 3D Domains,蛋白质功能区块立体结构数据 Gene,包含许多物种的基因数据库
Genome,包含超过800种物种的基因组数据库 GENSAT,小鼠中枢神经系统基因表现图谱
GEO Datasets,基因表现实验与生物芯片数值结果数据 GEO Profiles,基因表现图谱 HomoloGene,同源基因批注数据库 Journals,期刊文献(包含PubMed) MeSH,医学主题词数据库 NCBI Web Site,所有NCBI网页
NLM Catalog,美国国立医学图书馆馆藏书目、期刊、视听数据目录
Nucleotide sequence database,核酸序列数据库(包含GenBank、RefSeq和PDB等三大序列数据库)
4
Online Mendelian Inheritance in Man (OMIM),人类遗传疾病相关文献数据库 PopSet,族群演化分析相关研究资料
Protein sequence database,蛋白质序列数据库(包含Swiss-Prot、PIR、PRF、PDB等数据库与从GenBank、RefSeq核酸序列转译之蛋白质序列资料)
PubChem BioAssay,化学成分之生物活性筛选资料 PubChem Compound,小分子化学物质结构
PubChem Substance,具生物活性之化学物质筛选数据 PubMed,科学文献报导数据库
PubMed Central,科学文献数字全文数据库 Site Search,可搜寻NCBI的网页与FTP SNP,单点核酸多样性数据库(dbSNP) Structure,分子模型数据(MMDB)
Taxonomy,以核酸或蛋白质为基础的分类学信息 UniGene,人类unique基因序列数据库 UniSTS,unique序列卷标地址数据库
PubMed数据范围
数据类型:期刊论文、综述以及与其他数据资源链接。 特点:
免费提供题录和文摘
提供与原文的网址链接(部分免费获取) 提供检索词自动转换匹配 操作简便、快捷 MEDLINE
4800余种生物医学期刊,内容涉及医学、护理、牙科、兽医、健康保健系统、前临床医学等学科。这些期刊来源于美国和世界上70多个国家和地区。
文献量达1千2百多万条记录,并回溯到1966年。 记录中用[PubMed-indexed for MEDLINE]标记表示 In process citation
提供MEDLINE尚未经规范处理的数据。
5
获MeSH词后,再加入MEDLINE。 记录中用[PubMed-in process]标记表示。 Publisher Supplied Citations
出版商直接向PubMed提供电子记录 包括MEDLINE未收录的部分记录
记录中用[PubMed-as supplied by publisher]标记表示。 OldMedline
1950-1965年间发表的200多万篇文献 没有MeSH字段和摘要
记录中用[PubMed-OLDMEDLINE for Pre1966]标记表示。 PubMed not Medline
PubMed收录Medline不收录的文献。 记录中用[PubMed]标记表示。 PubMed与MEDLINE的区别
(1)收录范围广:
MEDLINE收录的部分生命科学相关文章的非医学专业期刊(物理、天文、化学等)
(2)收录记录新:
在MEDLINE数据标引前的最新题录 (3)文献类型全:
提供电子原文链接(部分免费) 认识PubMed
PubMed首页 PubMed检索结果页 PubMed结果显示 PubMed摘要显示
PubMed特色:简洁、清新,检索速度较快 PubMed检索方法
PubMed基本检索
6
PubMed高级检索 PubMed限定检索 PubMed主题检索 临床查询检索 PubMed全文获取 PubMed基本检索
在检索框中键入一个或多个英文单词(大写或小写均可),点击GO按钮,PubMed系统会自动在主题词表,期刊名表,短语表及作者索引中查询与输入的词相匹配的形式,这就是它特有的“自动词汇匹配功能”。
例如:检索肿瘤 (cancer)方面的文章。
在检索框中输入:“cancer”,再点击“Go”按钮。 PubMed将自动地利用它的“自动词汇匹配”功能将重要的词语结合在一起,并将不规范的词语转换成MeSH词表中规范的用词进行检索,比如,检索“cancer” 将自动转换为:\
自动转换匹配:
PubMed对输入检索框中的检索词进行智能化地校对,将其逐步地与其数据库中的各类术语匹配的原则。
布尔逻辑组合检索,常用的逻辑关系词有AND,OR,NOT等 作者姓名检索
按照姓+名缩写(不用标点)的格式键入作者姓名,如:smith ja或jones k, 系统会自动在作者字段内进行检索。姓名第一个字母可用大写也可用小写,姓前名后,姓用全称,名字一般用缩写。
考虑到作者姓名的不同形式,PubMed采用自动转换功能进行作者姓名检索,如:smith j将检索成smith ja,smith jb,smith jr 等。
精确检索:可以用双引号将作者名引起来,再加作者字段限定[AU],如:\,这样可避免PubMed自动转换,实现精确查找。
期刊检索
7
在检索框中键入期刊名,如:molecular biology of the cell,系统的“自动词语匹配”功能会将它转换成mol biol cell[journal]进行检索。
也可以直接输入Medline的期刊标准缩写形式,如:mol biol cell,或者是输入刊物的ISSN(国际标准出版物代码)进行检索,如:1059-1524。
如果一个杂志名恰好是主题词或关键词,如:cancer, science,cell等,PubMed会首先将这些词转换成MeSH词表中的主题词进行检索。因此,需要将检索请求进行标准化处理,即在杂志名后面加[TA]。如:\期刊数据库(journal database)
期刊数据库的作用:
1、可以查看期刊的详细信息,包括出版国家,出版社,出版语言,期刊类目等等;
2、可以根据期刊的主题分类,查看medline收录的各学科的期刊,比如查看medline收录的关于麻醉学(Anesthesiology)方面的期刊;
2、方便检索某本期刊上被PubMed收录的所有文章。
比如:我们想知道期刊Acad Pediatr的全称以及具体的出版社,以方便投稿,如何查?
操作方法:点击导航栏上的Journal database,打开期刊数据库检索界面,在检索框中输入Acad Pediatr,再点击Go按钮即可。 截词检索
截词检索的作用:扩大检索范围,提高查全率。
截词符:用*表示,代表多个字符,将*加在检索词后可以表示对所有以该词开头的词进行检索。
如:bacter*,可以检出bacter,bacteria, bacteriophage ,bacterium,等最多600个单词。 字段限制检索
采用字段限制方式进行检索,其规则是:
检索词1[字段标识] 逻辑运算符 检索词2[字段标识]
如:查找作者为crick在1993年发表的有关DNA方面的文献. 检索式:
DNA[mh] AND crick[au] AND 1993[dp]
8
常用检索字段描述和标识 Title[ti]:篇名字段 Abstract[ab]:摘要字段
Affiliation [ad]:著者地址字段。
Author name[au]:文章的作者,检索格式:姓+名。如:\Journal title[ta]:期刊名称。如:cell[ta]
Language[la]:论文出版语种。语种检索时可只输入前3个字母,如:chi[la]=chinese[la];English[lang]=eng[la]
比如:检索文章题目中含有高血压的中文文献 检索式:hypertension[ti] AND chi[la] Publication date[dp]:出版日期 指论文所在期刊的出版日期
日期检索的形式为:YYYY/MM/DD[DP]
要检索一段时期内的文章,日期之间可以加冒号,如: 1993/01:1995/06[DP]
Publication type[pt]:出版类型。有综述,新闻,传记,临床试验等。如:review[pt] MeSH terms[mh]:主题词字段。如:hypertension[mh] Subheadings[sh]:副主题词。与主题词组配检索.
比如:检索1995年到1996年出版的关于高血压方面的综述性文献。 hypertension[mh] AND 1995/01:1996/12[DP] AND review[pt] 强制检索功能
PubMed允许使用双引号来强制系统进行短语检索。
如:在PubMed主页的检索提问框中键入“single cell”,并用双引号引起来。点击“GO”按钮,系统会将其作为一个不可分割的词组在数据库的全部字段中进行检索。
如果不使用双引号进行强制检索,系统就会将其分成2个词:single和cell检索,其检索表达式为:single AND cell. 很明显这样的检索结果是不符号要求的。
PUBMED 高级检索及限定检索
9
PubMed主题检索
《医学主题词表》数据库(MeSH Database)
《医学主题词表》是对生物医学文献进行主题分析、标引和检索的权威性词表,它的作用是使医学文献的主题标引和检索达到统一和一致,并指导用户高质量地检索医学文献。它可以指导用户从同义词发现主题词,告诉用户主题词如何使用,显示主题词之间的相互关系。 《医学主题词表》数据库(MeSH Database) 利用主题词进行检索 方法:
1、点击主页右下角的MeSH Database进入主题词检索界面; 2、输入检索词后,点击go按钮,系统将显示与该词有关主题词;
3、点击该主题词进一步显示该主题词的定义、树状结构、组配的副主题词; 4、选择合适的主题词与副主题词后,点击send to按钮,进入检索表达式浏览窗口;
5、点击Search PubMed将显示检索结果。 临床查询检索
“Clinical queries”是专门为临床医生研究设计的内置的临床方法学“过滤器” (Clinical Methodology Filters),这组检索策略模型是由加拿大临床流行病学和生物统计学研究人员Haynes RB等人在1994年提出来的,并进行了查全率和查准率分析。用户通过这一临床方法学检索过滤器,不需掌握复杂的检索策略,即可检索所需的临床研究文献。
使用方法:
1、点击主页左侧导航栏的Clinical Queries进入临床查询页面;
2、在检索框中输入检索词,并选择副主题词组配,指定检索结果是查全(sensitive),还是查准(specific);
3、点击GO按钮执行检索。
例如:检索“鼻咽癌nasopharyngeal cancer治疗方面的研究文献” PubMed全文获取
通过PubMed检索出来的文献,部分我们通过浏览摘要即可,部分我们还需
10
要查看全文,以作进一步的研究,那么,我们如何获取全文呢?
一:免费的全文 二:学校已订购的全文
如果我们所需要的文献,学校已订购了该文献所在的全文型数据库,我们也可以直接打开或到相应的全文数据库中查找。
三:文献传递服务系统
没有免费的全文以及学校未订购的全文,一般需要付费才可以看到,这类文献我们可以通过基于馆际互借的文献传递服务系统来获取。 PubMed RSS学科跟踪
RSS,也称为“RSS 源”、“XML源”或“Web 源”等,通常在时效性比较强的内容上使用RSS订阅能更快速获取最新信息,利用PubMed的RSS服务,有利于第一时间获取国际上关于某课题或某一方面的最新报道。
比如,我是一名临床大夫,我比较关注国际上关于鼻咽癌nasopharyngeal cancer治疗方面的最新报道,我该如何订阅这个最新报道(RSS)呢?
订阅最新报道(RSS)首先需要自己制定一个检索式: 说明:
订阅临床方面的RSS(比如某种疾病的诊断或治疗等),建议通过临床查询(Clinical Queries)来检索,这样可以确保检索质量;
订阅课题方面的RSS,建议通过自由词来检索,这样可以检索到最新的电子优先文献,若检索结果在100条以上,建议进一步限定;
首次订阅PubMed RSS,系统默认会为订阅者提供目前所能检索到的所有文献的全文,如果您只需要以后更新的最新文献(不需要这些目前能检索到的文献),请单独说明。
11
MEDLINE是美国国立医学图书馆(TheNationalLibraryofMedicine,简称NLM)生产的国际性综合生物医学信息书目数据库,是当前国际上最权威的生物医学文献数据库。内容包括美国《医学索引》(IndexMedicus,IM)的全部内容和《牙科文献索引》(IndextoDentalLiterature)、《国际护理索引》(InternationalNursingIndex)的部分内容。
涉及基础医学、临床医学、环境医学、营养卫生、职业病学、卫生管理、医疗保健、微生物、药学、社会医学等等领域。
MEDLINE收录1966年以来世界70多个国家和地区出版的3400余种生物医学期刊的文献,近960万条记录。目前每年递增30-35万条记录,以题录和文摘形式进行报道,其中75%是英文文献,70%-80%文献有英文文摘。
到1988年底,约有近20个机构获准转换MEDLINE数据库,发行MEDLINE的CD-ROM产品,其中包括Silver Platter、 Cambridge、 Dialog等。上述公司产品的检索功能、检索指令、数据结构虽基本相似,但也有不同。由于国内引进的大部分为Silver Platter公司的产品,故以Silver Platter的MEDLINE CD-ROM为例介绍光盘检索系统的使用。
Medline主要提供有关生物医学和生命科学领域的文献,数据可回溯到1949年。可通过主题词,副主题词,关键词,篇名,作者,刊文,ISSN,文献出版,出版年,出版国等进行检索。professional适合临床医学,其余三种内容相同,但advanced和express功能比较优越,检索方便,standard对更新要求较低,不需光盘塔。MEDLINE光盘文件补充和更新的频率为每月一次,可运行在DOS和WIN环境。
PubMed是免费的网上Medline数据库,它还包含一些最新的尚未被索引的文献。
Pubmed=medline+premedline+出版商提供的信息 也可以简单地认为Pubmed是medline的网络版
12
PUBMED 里MeSH是什么意思?
《医学主题词表》(Medical Subject Headings,简称MeSH),是美国国立医学图书馆编制的权威性主题词表。它是一部规范化的可扩充的动态性叙词表。美国国立医学图书馆以它作为生物医学标引的依据,编制《医学索引》(Index Medicus)及建立计算机文献联机检索系统MEDLINE数据库。《MeSH》汇集约18,000多个医学主题词。
《MeSH》在文献检索中的重要作用主要表现在两个方面:准确性(准确揭示文献内容的主题)和专指性。标引(对文献进行主题分析,从自然语言转换成规范化检索语言的过程)人员将信息输入检索系统以及检索者(用户)利用系统内信息情报这两个过程中,以主题词作为标准用语,使标引和检索之间用语一致,达到最佳检索效果。
在进行检索时,用户输入一个主题词后,系统会自动显示该主题词所能组配的副主题词。《MeSH》有一个副主题词表,1989-1990年IM使用的副主题词是77个,1991-1994年是80个,每年略有变化。目前IM使用的副主题词是92个。
副主题词(Subheadings)又称限定词(Qualifiers),与主题词进行组配,对某一主题词的概念进行限定或复分,使主题词具有更高的专指性。如诊断(Diagnosis,DI)、药物治疗(Drug Theray,DT)、血液供给(Blood Supply,BS)等。正确选择副主题词也很关键。例如肺发育不全,输入主题词“肺”后,在副主题词菜单中选择“畸形”表示发育不全;再例如,双子宫 ——用 子宫/畸形 检索。
(3)在《医学主题词注释字顺表MeSHAAL》中,对每个范畴类目的主题词和副主题词的组配原则进行了严格规定,组配时要按照规则进行。
例如,副主题词治疗therapy与疾病主题词组配,可用于综合疗法。例如,消化性溃疡的心理疗法,用消化性溃疡/治疗;心理疗法。
副主题词治疗应用therapeutic use 与药物、生物制品和物理作用物主题词组配。指用于预防和治疗疾病,包括兽医用药。例如,红霉素治疗链球菌感染,用红霉素/治疗应用;链球菌感染/药物疗法。
在检索中,主题词与副主题词的组配(主题词/副主题词)两者间须有必然的逻辑关系,善于分析两者之间的关系(因果关系、应用关系等)是正确组配的关键。例如,眼结核引起失明,用结核,眼/并发症;盲/病因学。牛奶引起动脉
13
硬化,用牛奶/副作用,动脉硬化/病因学。阿司匹林治疗感冒,用阿司匹林 /治疗应用;感冒/药物疗法。
MeSH 附有各种参照和注释,它是对生物医学文献进行标引和检索的依据。例如,在《医学主题词注释字顺表MeSHAAL》中, 该表的参照系统:
①用代参照,用 “See”表示。指引检索者将非正式主题词用正式主题词。例如,Cancer See Neoplasms。通过用代参照处理,从若干同义关系的词或词组中,选定一个科学而通用的名称作为主题词,供检索文献用。
② 相关参照:用相关参照“See related”表示。目的是指引检索者从一个主题词去参考有关的其他主题词,以扩大选词范围。例如,检索 Alopecia(脱发)这一概念时,要把它的相关参照Alopecia Mucinosa(斑秃)、 Baidness(脱发)、 Hair Diseases(毛发疾病) Hypotrichosis(毛发稀少)等4个相关参照词下的内容看清楚,才能达到查全的目的。
(6)为了使主题词具有系统性,MESH引入范畴表(Categories and Subcategories)的概念。范畴表又称树形结构(Tree Structure),是将字顺表中的主题词(主要叙词)、次要叙词按其学科性质、词义范围的上下类属及派生关系,分别划为15大类。在15个类目中,有 9类又分若干子类目,子类目下面又分若干更小的类目,这就是通常供检索使用的主题词,共一万六千多个,都按其医学概念的性质分别列入各自所属的类目之下。
14
正在阅读:
Pubmed检索-讲稿10-15
葡萄培训测试题A11-08
生化大实验报告 - 图文09-18
镇年度工作总结和来年工作计划08-04
截洪沟设计说明05-30
高考话题作文古今中外名人事迹素材05-01
大学英语实践教学的效果探析10-22
辽宁省沈阳龙玉元商贸有限公司2013年中考数学模拟试题(12)05-26
高中英语必修1_课文翻译(人教新课标)07-29
- 多层物业服务方案
- (审判实务)习惯法与少数民族地区民间纠纷解决问题(孙 潋)
- 人教版新课标六年级下册语文全册教案
- 词语打卡
- photoshop实习报告
- 钢结构设计原理综合测试2
- 2014年期末练习题
- 高中数学中的逆向思维解题方法探讨
- 名师原创 全国通用2014-2015学年高二寒假作业 政治(一)Word版
- 北航《建筑结构检测鉴定与加固》在线作业三
- XX县卫生监督所工程建设项目可行性研究报告
- 小学四年级观察作文经典评语
- 浅谈110KV变电站电气一次设计-程泉焱(1)
- 安全员考试题库
- 国家电网公司变电运维管理规定(试行)
- 义务教育课程标准稿征求意见提纲
- 教学秘书面试技巧
- 钢结构工程施工组织设计
- 水利工程概论论文
- 09届九年级数学第四次模拟试卷
- 讲稿
- 检索
- Pubmed