搜索引擎原理和优化 -

更新时间:2023-12-08 11:13:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

搜索引擎原理和优化

设计搜索引擎有好的页面和网站 搜索引擎可以索引的内容

搜索引擎不能察看flash, image, java脚本里的内容,只能查看html和text的内容。 搜索引擎查看页面内容,根据内容把页面加入关键词索引里。搜索引擎还要访问页面的链接结构,这样它可以通过链接访问网站其他地方,以便找到网站所有的内容。很多站处理导航都犯了错误使搜索引擎不能访问,这严重影响到他们的站被搜索引擎索引。再好的页面,如果从网站首页没有一个链接链路能找到,搜索引擎都不会去索引它。 连接的形式如下:

疑难病咨询医疗网

http://www.99eyao.com 是超链接,是链接打开的目标网页,访客不能直接看到链接地址。 疑难病咨询医疗网 是锚文字,是描述目标页面的文字。

这是链接的基本格式,搜索引擎能理解它,把它加到对网站建立的链接拓扑图里,用它来计算网站权重(类似google pr值),并用它查询目标页面的内容。 http://www.seo-browser.com/ 察看页面在搜索引擎眼里的样子

一些网页不能被搜索引擎找到的原因。

1. 连接在提交的form里。 2. 链接在javascript里

3. 链接的地址被meta root tag 和 robots.Txt文件阻止了。(站长常常不自觉用此指令

阻止搜索引擎访问站内的不良信息,这些信息可能使搜索引擎不再爬他们的站) 4. 在frames或子frames里的链接

5. 只能通过搜索访问到的链接。搜索引擎不会在站内执行搜索 6. 在flash, java, 或其他插件里的链接

7. 链接在包含成千上万链接地址的页面里。搜索引擎在一个页面里只爬大约100个链

接。这是为了减少垃圾信息,保护权重。

http://www.seo-browser.com/ 察看页面在搜索引擎眼里的样子

nofollow 属性

使用 rel=”nofollow” 属性,如:99eyao.com它告诉搜索引擎此链接跟其他的一般链接不同,不需要处理。但每个搜索引擎对此处理方法不同。当要阻止自动博客签名,留言本,链接注入垃圾时使用。

关键词

搜索引擎不是把所有页面放到一个数据库,那样数据库会变得太庞大。引擎有几百万个小数据库,每个是围绕一个特定关键词或短语。这使取出数据时会很快。显然要想你的页面有机会列在某个词的搜索结果里,你要确保这个词出现在你文章的可索引内容中。

关键词控制(Keyword Domination) 关键词控制我们的搜索意图。引擎基于输入的关键词知道哪些页面被取出来。而另外一些相关数据,如变化顺序的词组,拼音,读音,变化的相关词提供额外信息,引擎也用于帮助取出正确的页面并给他们定级别。显然,引擎测量关键词在页面里的使用情况来决定页面对某个搜索的相关性。因此优化一个页面的最好方法是:确保关键词出现在标题,正文和meta数据里。有的词用得广泛如“书“,有的词很特殊,如“双城记“,这样组合起来的搜索结果也不会太大。 关键词密度

关键词密度经常用于页面搜索优化,但实际上这是个误传。商业搜索引擎处理文字时并不考虑关键词密度。 单页优化

1) 在title里至少出现一次关键词,如果读起来通顺可以出现两次。尽量使关键词靠近title的开头。

2) 在H1标签里出现关键词

3) 至少在body里出现3次,如果text内容多可以多出现几次。也许你发现添加多于3次关键词有更多好处,但添加一个词或短语更多次对增加评级只有很少甚至没有作用。 4) 至少有一次标记为粗体,可以用标签。

5) 至少一次出现在图片的alt属性里。这不仅有利于网络搜索,也有利于图片搜索,也可以带来可观的流量。

6) 至少一次出现在链接URL中。此方法只对英文有用。

7) 至少一次出现在meta描述标签中。注意,描述标签不参与评级,但能帮助吸引搜索者点击页面链接。因为它被搜索引擎用作页面简介。 8) 一般不要用作指向外部网站的锚文字。

标题标签 title

标题是对页面内容的一个精确、简洁、描述性强的说明。它对提高用户体验和搜索引擎优化都有好处。下面的建议是为了提高搜索优化和可用性:

1) 注意长度。70字符是搜索结果显示的最大长度。然而如果你目标关键词有多个,或关键词短语很长,可以加长标题。

2) 把最重要的关键词放在靠前的地方。越靠前,评级越高,用户更愿意点击。 3) 改变品牌化。把网站的品牌关键词放在最后而不是最前面。 4) 考虑可读性和感情影响。创建一个引人入胜的标题,可以从搜索结果吸引更多访问者并且帮助访问者了解你的网站。不要只考虑优化和关键词使用,而要考虑更多用户体验。标题标签给新访问者对你的品牌的第一印象,必须尽可能表达最好的正面印象。

Meta标签

Meta robots 在页面级控制搜索引擎蜘蛛的活动。有几种控制方式:

1) index/noindex 告诉搜索引擎页面是否应该被抓取并保存。如果用noindex,页面不会被

引擎抓取,默认值是index,允许引擎抓取。

2) follow/nofollow 告诉引擎此页面上的链接是否应该被抓取。如果是nofollow,引擎就不

会对此页上的链接做处理(抓取链接地址页面,评级)。默认值是follow。

3) noarchive用于限制引擎保存页面快照。默认,引擎会维护所有被索引的页面的复件,让

搜索者可以通过快照页面链接来访问搜索结果。

4) nosnippet 告诉引擎它应该不要在搜索结果上在title和url后显示一个描述性的文字。 5) NoODP 是一个专门的标签,告诉引擎不要从开放目录项目(DMOZ)取得关于一个页

面的描述信息。

6) NoYDir 和NoODP类似,特定于yahoo,告诉引擎不要用yahoo里关于页面/站点的目

录描述做搜索结果。 Meta description

是一个简短的关于页面内容的描述。搜索引擎不用这个标签里的关键词或短语来评级,但描述是搜索结果里显示的简介的主要文字来源。描述文字带上关键词,google会把描述里的关键词加粗显示在搜索结果上,吸引人的,广告性强的描述能更好的吸引搜索者点击你的页面。描述可以是任意长度,但搜索引擎一般会缩短长度为大约160字符,因此一般描述长度要在这个限制之内。 Meta keywords

此标签曾经有用,但现在不再是搜索引擎优化的重点。 Meta refresh, meta revisit-after, meta content type, etc

URLs

是页面的网络地址,从搜索看是重要的。url会显示在搜索结果上,他会影响点击率。带关键词的,或含义清晰的能提高点击率。url里包含适当的,描述性的关键词也会利于页面评级。Rul在浏览器地址栏里显示,差的url结构和设计会带来不好的用户体验。Rul还常常在博客里作为链接的锚文字显示。 Rul创建指南

? 从访客的角度看链接,是否合适的,有描述性的。能容易的,预测出页面的内容。不用

读出每个url细节,而一个粗略的想法就知道页面内容。

? 越短越好。出现关键词很重要,但重复使用多个关键词就危险了,可能导致不能用的

url,导致被垃圾过滤器过滤掉。

? 静态页面地址比动态好 ? 尽可能选择描述性强的地址 ? 使用-分隔单词

标准化和重复的内容

一段文字,或一个文章,或整个页面的内容可能在一个网站的多处出现,甚至在多个网站上出现。搜索引擎会抓取某个内容的多个版本。为了提供最好的搜索体验,它很少显示重复的内容,还要选择哪个版本可能是最初版(最好的)

标准化是一个行动,组织你的内容,使每个唯一的内容有且只有一个url。基于这个处理,你可以确保搜索引擎会只找到某个内容的一个版本并给它最高的评级(基于你的域名影响力,可信度,关联性及其他因素。)如果有多个版本的内容在一个网站或多个站,你的评级会大打折扣。

如果这些页面用301重定向到一个页面,引擎就有唯一一个更强的页面来显示在搜索结果列表里。

当多个潜在评级好的页面组合到一个页面,就创建了一个更强相关性更受欢迎的页面。这可以得到搜索引擎更好的评级。

另一个不同的方法可以减少一个站里的重复内容。叫Canonical URL Tag。

这个标签告诉yahoo,bing, google 此页被看作是rul指向的页面的拷贝,并且所有的链接和内容都应该按那个rul来处理。当前页仅用于展示,不做评级。在SEO的角度,Canonical URL Tag 在很多方面类似于301重定向。实质上,你告诉引擎:

多个页面要被看作一个,不用实际重定向访客到新的url

有一种情况,两个版本的同一个内容是需要的,如一个标准网页版和一个打印版的内容。我们把打印版都301重定向到原始版,然后创建一个css来展现打印友好的格式。(在同一个url上展示两个版本),这使原始版页面短时间增加了很多流量(原来打印版的流量被引入到原始版)。

守卫你网站的荣誉

网络上充满了成千上万的无道德的网站,它们经营模式就是把其他网站的内容拿来重用在自己网站(有时修改后重用)。这种拿你的内容重新发布叫scraping,抄袭者们通过抄袭高质量的网站的内容,然后显示广告来赚得不错的薪水(讽刺的是google 自己的adSense也是这样运行的)。

当你发布任何格式的内容时(RSS/XML/etc),确保ping services ,或使用像pingomatic的服务自动处理。作用是通知google , yahoo 你的网站内容有更新了。下一步,可以利用抄袭者的懒惰,大部分抄袭者不做修改就重发布内容,因此在内容里包含你的网站的链接,注明作者的名字,这样搜索引擎可以通过这些抄袭的页面回到你的网站(指示了你可能是原创者)。你需要用绝对地址而不是相对地址。Home

有很多其他方法保护被抄袭,但没有一个万无一失的方法。你应该能看到你的站点越流行,可见度越高,你更容易发现你的内容被抄袭。通常你可以忽略这个问题,但如果非常严重,

本文来源:https://www.bwwdw.com/article/hx3t.html

Top