搜索引擎的工作原理及使用技巧

更新时间:2024-03-13 09:01:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

搜索引擎的工作原理及使用技巧

互联网的发展和普及给人们的生活带来了很大的便捷,由此带来的信息革命正在不断的改变着人们的生活,现在的人们已经习惯了在碰到信息方面的困难时求助于互联网络。在浩若烟海的互联网上查找有用信息的有效途径就是使用搜索引擎,搜索引擎能在数秒之内把使用者需要的信息经过搜索过滤后呈现出来,用户可以在过滤后的结果中甄别自己需要的内容。搜索引擎非常有用,我们有必要对它进行了解,掌握使用技巧,以便在互联网的使用上掌握更大的主动。

1.搜索引擎的发展里程

1990年以前,是互联网发展的早期,网络信息量较少,互联网用户多为专业人士,还没有搜索引擎出现。之后,随着互联网的发展,网络上的信息量越来越多,这时为满足大众信息检索需求的搜索引擎便应运而生了。

1990年由蒙特利尔大学的学生AlanEmtage等人发明的Archie是最早的搜索引擎。当时3w网还未出现,网络的主要用途是传输文件,大量的文件散布在各个分散的FTP主机中,查询起来非常不便,于是AlanEmtage等人开发一个可以用文件名查找文件的系统,这便是最早的搜索引擎Archie。1994年4月,斯坦福大学的两名博士生DavidFilo和美籍华人杨致远共同创办了超级目录索引Yahoo,并成功地使搜索引擎的概念深入人心。1998年,斯坦福大学的两位博士生LarryPage和SergeyBrin开发出了现在世界上最大的搜索引擎Google。通过对20多亿网页进行整理,Google可为世界各地的用户提供需要的搜索结果,搜索时间通常不到半秒。2000年1月,两位北大校友李彦宏与徐勇在北京中关村创立了百度公司,经过几年的高速发展后,百度已经成为全球十大网站之一。2002年,中国搜索正式进入中文搜索引擎市场。在此后几年的时间里,已经发展为全球闻名的中文搜索引擎服务商,为新浪、搜狐、网易、TOM等知名门户网站提供搜索引擎技术。

2.搜索引擎的分类及其工作原理 能够建立数据库并提供查询、获得网站网页的系统都可以叫搜索引擎。按照工作原理不同,搜索引擎可以分为两个基本类别:全文搜索引擎和分类目录搜索引擎。在互联网上,有些网站对上面两种基本类别进行了整合,又产生了另外两种搜索服务,即元搜索引擎和集成搜索引擎。下面简述其工作原理。

(1)全文搜索引擎

全文搜索引擎一般都有一种叫作“网络机器人”或“网络蜘蛛”的软件,这些软件能遍历WEB空间,扫描一定IP范围内的网站,并延着网络上的链接从一个网页到另一个网页,从一个网站到另一个网站采集网页资料。为了保持网页资料的最新,它还会回访已抓取的网页。对已经抓取到的网页,搜索引擎还会用一定的程序进行分析,根据一定的相关度算法建立网页索引,添加到索引数据库中。全文搜索引擎因为依靠软件进行采集网页,所以数据库的容量非常庞大,但是,它的查询结果往往不够准确。我们平时看到的全文搜索引擎,实际上是只是一个搜索引擎的搜索界面。当我们输入关键字进行查询时,搜索引擎便会从宠大的索引数据库中找到包含该关键字的所有相关网页的索引,并按一定的排名规则呈现给我们。不同的搜索引擎,网页索引数据库也不同,排名规则也不尽相同,所以当我们以同一关键字在不同的搜索引擎上进行查询时,搜索的结果和排列顺序通常也不相同。典型的全文搜索引擎有百度、谷哥等。

(2)分类目录搜索引擎

和全文搜索引擎一样,分类目录搜索引擎的整个工作过程同样也经过收集信息、分析信息和查询信息三部分,只不过分类目录搜索引擎的前两部分,收集信息和分析信息全部由人工来完成。分类目录一般都有专门的编辑人员,负责收集网站的信息。分类目录依靠人工收

集和整理网站,能够提供更为准确的查询结果,但收集的内容却非常有限。目前如雅虎、新浪等大型网站,均有自己的分类目录搜索引擎。

(3)元搜索引擎

这类搜索引擎一般都没有自己的网页搜索软件以及数据库,它的搜索结果是通过调用、控制和优化其它多个独立搜索引擎的搜索结果并以一定的格式在同一界面集中显示。通常元搜索引擎虽然没有自己的“网络机器人”或“网络蜘蛛”,也没有自己的独立数据库,但它在索引请求提交、检索接口代理和检索接口显示等方面,均有自己开发的具有特色的元搜索技术。在搜索结果上,这些元搜索引擎往往搜索范围更大一些。如较大的中文元搜索引擎“搜乐”,域名为http://www.sooule.com/,能同时在8个大型搜索引擎上进行搜索。

(4)集成搜索引擎

集成搜索引擎是通过网络技术,在一个网页上链接很多个独立的搜索引擎,查询时,点选或指定搜索引擎,一次输入,多个搜索引擎同时查询,搜索的结果由各个搜索引擎分别以不同的页面显示。比如全球最大的集成搜索引擎第九门,域名为:http://www.9om.com/,就可以在300多个搜索引擎上进行搜索。

3.搜索引擎的使用技巧

不同的人进行网页搜索的效率通常是不一样的,有的人能找到需要的东西,有的人找不到需要找的东西,有的人找起来较快较准,有的人找得较慢较散。产生这样的差别,原因是人们使用搜索引擎的方法技巧不同。要提高搜索效率,需要掌握一定的搜索语法,还需要养成良好的搜索习惯

(1)搜索引擎的常用语法

专业的搜索引擎一般都会实现一些搜索语法,使用搜索语法可以实现一些更为精确的查询。搜索引擎常见的基本搜索语法主要有: “+”或“空格”:表示的关系是与关系,用它连接的查询词必须同时出现在搜索到的网页中。比如查询“陕西+天气预报”,表示两边的词条要同时出现在查询结果中。

“or”或“|”:表示的是或关系,用它连接的查询词可以只有一个出现在搜索到的网页中。比如查询“2008or奥运会”,则查询结果中,可能出现是的“2008”,或者“奥运会”,或者二者同时出现。

“—”:表示非关系,要求查询的结果中不包含该运算符右面的词条。用户在查询时,如果如果发现查询到的网页里都明显包含某个不希望看到的关键词,就可以用这个符号将其右侧的关键词过滤掉。

“intitle”:使用该词能将搜索的范围限制在网页标题中。网页标题是对网页内容提纲挈领式的归纳,把查询的范围设定在标题中,往往能够获得良好的效果。比如:要查找姚明的蓝球赛,可以这样查询:“蓝球赛intitle:姚明”,查询结果的标题里都会包含“姚明”。

“site”:表示把搜索范围限制在特定的站点中。有时,如果要在某个站点中查询某个东西,则需要把查询的范围缩小在某个网站中,使用的方法是在查询内容后面加上“site:站点域名”。例如要从华军网站上下载qq软件,则可以这样查询:“qq site:huajun.com”。注意在此用法中应该去掉网站域名前面的“http://www.”。

“inurl”:表示把关键词的搜索范围限制在超链接中。如果要查询超链接中具有某个关键词的网页,就可以使用此方法。比如,如果要查找“软件”且在在超链接里有“xi’an”关键字的网页,就可以使用“软件inrul:xi’an”来进行查询。

“filetype”:该词的功能是对搜索对象进行限制,冒号后是文档格式,可以是doc、pdf、xls等。比如用“旅游 filetype:pdf”,表示搜索的是包含有“旅游”的pdf格式的文档。 另外,当我们对某一关键词要进行精确匹配时,我们可以在搜索时给这个关键词加上一个双引号或者加上书名号。这样在搜索时,就可以对全部关键词进行完全匹配,不会进行部

分匹配了,用此方法可以进行比较严格的查询。

(2)养成良好的搜索习惯 善用搜索引擎的人,一般都具有较好的搜索习惯。好的搜索习惯能够使用户的搜索效率更高。那么什么是好的搜索习惯呢?笔者认为以下习惯可以算做比较好的搜索习惯。

①要善于选择合适的关键字。搜索时,关键字一定要选具体的,典型的,具有代表性的词条,关键字选取的恰当与否直接影响搜索效果。因此,搜索的时候,一定要仔细考虑所选择的关键字是否恰当和具有代表性。在一个搜索引擎得不到理想结果的情况下,可以尝试选用不同的关键字进行搜索。

②要习惯应用搜索语法。恰当的使用搜索语法,会使搜索效果更高,比如你要下载歌曲“故乡的云”的歌词,使用“故乡的云歌词”这个关键字去搜索,结果肯定不理想。但你如果使搜索语法,输入“故乡的云 歌词”,于是中间用空格形成一个并关系,这样搜索的效果就会好很多。

③要善于在搜索的结果中甄别所需要的东西。一个关键字搜索出来的结果有成千上万条,如何在搜索结果中甄别需要的网页,需要使用者根据平时的搜索经验,从搜索引擎列出的网页索引数据中判断该网页是否包含要找的内容。这是一个需要长期尝试和总结积累的过程。

④要习惯使用多种搜索引擎进行搜索。不同的搜索引擎,其索引数据库中包含的内容通常不尽相同。有时在这个搜索引擎中找不到的内容,在另外一个搜索引擎中却能找到。这就需要使用者在搜索的时候,对于找不到的东西,可以换几个不同的搜索引擎尝试一下,不但使用全文搜索引擎,还可以使用分类目录搜索引擎,以及元搜索引擎和集成搜索引擎,这样找到所需内容的概率会更大一些。

上面提及的几种搜索习惯,只不过是良好搜索习惯的一部分,用户可以在使用搜索引擎的过程中不断积累经验,比较总结,养成良好的搜索习惯。

4.小结

搜索引擎是人们访问网络资源的一个利器,通过它能够方便的查找全球各地的网络资源。本文讲解了搜索引擎的发展历史、工作原理、以及常用的搜索语法,列举了一些良好的查询习惯。读者通过对本文的阅读,能够了解搜索引擎发展和应用的基本情况,掌握一些基本搜索语法和搜索技巧,提高网络查询能力,使自己在互联网的应用上掌握更大的主动。

本文来源:https://www.bwwdw.com/article/ran8.html

Top