Google--PageRank(网页级别)技术解密(二)
专业网站搜索引擎优化及Google排名优化服务

Google--PageRank(网页级别)技术解密(二)


http://www.cuteseo.cn  CuteSEO  搜索引擎优化  2008-3-13  《Google--PageRank(网页级别)技术解密(二)》相关文章  

7. 非PageRank因素阙值
8. 使用阙值推知两种排名策略的价值
9. PageRank的计算

七:非PageRank因子的上限阙值(Non-PageRank Factor Threshold)
除了PageRank外,其它排名因子都存在一个阙值,也叫临界值或差值。即当增长到一定值时,因子的重要性反而开始慢慢降低,则该值就是非PageRank因子的阙值。

设阙值为1,000,如果网页A和B是我们对某一查询条件的其中两个查询结果,且A的总分数(包括页面因子得分和PageRank得分)是900,B是500网站优化服务,则显然A会排在B的前面。但由于A和B的分数均低于我们上面假设的非PageRank因子阙值,因而在不改变PageRank的情况下,我们可以通过对B页进行精心的页面优化使页面因子分数得到提高来使其排名超过A。但如果A的总得分升至1,100分,则B若还只是一味优化页面因子是远远不够的。在这种情况下,提升PageRank就成为首要任务了。

一般说来,Google的查询结果页中既可能包含一些分数超过阙值的网页,也可能包含一些分数低于阙值的网页。所以:

为了提高竞争能力,必须在阙值范围内尽可能提高页面的搜索引擎排名得分,否则会降低页面的竞争力。“页面因子”是接近和达到阙值最迅捷的方式,它与PageRank的结合使用才是提升网站排名得分的最佳优化策略。

八:使用阙值推知两种排名策略的价值
阙值解释了搜索引擎商所遵循的原则和不同的实施途径,同时亦阐述了为什么会产生关于PageRank的一些误解。我们可以把这两种策略当成两个人A和B。

A认为“PageRank”并不重要。他们已有数年网页优化经验并知道如何完美地利用“页面因素”来达到优化的目的。他们亦理解基本的锚文本,但对PageRank得分毫不在意。结果如何呢?由于最大化地使用了“页面因子”,从而使A迅速达到“非PageRank因子的阙值”。所以通过精心选择关键词可使他们获得较好的网站排名。而且只要网站内容比较好,随着时间推移总会有排名高的站点链接,涓涓细流汇成河。A最后亦得到了PageRank得分,并籍此巩固了排名。

B认为“PageRank”十分重要。他掌握了很多关于提升PageRank得分的信息,并为提高该得分下足了工夫。结果又如何呢?B的做法和A相反,但A在非PageRank因子上下工夫,结果却得到了PageRank得分。而B在PageRank因子上下工夫,结果却得到非PageRank因子得分。究其原因,就是由于提高PageRank得分需要外部链接,链接又具有锚文本,从而通过精心挑选外部链接的锚文本,B自发提高了其非PageRank因子的得分,从而赢得了较高的PageRank得分。

虽然这只是两个极端,但我们可以利用它们来推知这两种途径各自的优缺点:

对象 优点 缺点 A:忽略PageRank

  • 网站排名在短期内就可得到提升
  • 自我生成链接节省了工作量
  • 需投入大量工作维持网站排名
  • 对新竞争者的应变速度较慢 B:忽略页面排名因子
  • 可获得可靠网站排名,并可在需要时轻松修改页面因素使排名迅速提升
  • 极可能从非搜索类引擎来源上获得更高访问量
  • 网站排名提升较慢
  • 操作难度较大
  • 容易为SPAM过滤程序所制



    对象 优点 缺点
    A:忽略PageRank 网站排名在短期内就可得到提升

    自我生成链接节省了工作量
    需投入大量工作维持网站排名

    对新竞争者的应变速度较慢

    B:忽略页面排名因子 可获得可靠网站排名,并可在需要时轻松修改页面因素使排名迅速提升

    极可能从非搜索类引擎来源上获得更高访问量
    网站排名提升较慢

    操作难度较大

    容易为SPAM过滤程序所制

    事实上,我们前面说过,最终排名得分=所有非PageRank因子实际得分x实际PageRank得分。亦即二者相辅相成,再加上随着网上营销方式的发展壮大,关键词的竞争也变的愈来愈激烈,这种情况下只靠非PageRank因子得到好排名显然是不可能的。而且非PageRank因子存在着阙值的局限性。同时,对于竞争性极高的关键词,还存在着PageRank下限的问题。也就是说,除非网站的PageRank得分超过这个下限标准,否则网站排名很难上去。PageRank的下限由关键词的竞争度所决定。竞争性一般的关键词PageRank下限也不高,而对竞争较为激烈的关键词来说,它所要求的PageRank下限相应就要高。而PageRank得分的提升又非常有难,这时候非PageRank因子就变的非常重要了。
    综上所述:我们需要充分发挥各排名因子的优势来赢取理想的综合排名得分。同时关键词(竞争度适宜)的精心选择亦变的非常重要,它可以节省大量的支出。

    九:PageRank的计算方法
      PageRank (A) = (1-d) + d(PageRank (T1)/C(T1) + ... + PageRank (Tn)/C(Tn))
      其中PageRank (A)表示给定页面A的PageRank得分;
      D为阻尼因子,一般设为0.85;
      PageRank (T1)表示一个指向A页的网站其本身的PageRank得分;
      C(T1)表示该页面所拥有的导出链接数量;
      PageRank (Tn)/C(Tn)表示为每一个指向A页的页面重复相同的操作步骤。

    事实上,计算某个页面的PageRank得分需要大量繁复计算。例如若计算A页的PageRank得分则首先要知道所有链至A页的网页(导入链接)的PageRank得分。要想知道这些外部链接页的PageRank得分,又需要先知道这些页面的外部链接的PageRank得分,等等。我们只需要知道:

    A页的外部链接B能够带给A的PageRank得分与B的导出链接数量成反比,即随着B上导出链接数的增加,带给A的PageRank得分亦随之降低。这同样表明了一个网页的PageRank得分是该网页对其它页面投票的一个基本的度量形式。一个网页可以投票给一个或多个导出链接,但其总投票权一定,并被平均分配给所有的导出链接。假设B的PageRank得分是5,且B上只有一条指向A的链接,那么A将获得B全部的PageRank得分(B没有损失任何东西,而A赢得了B的PageRank得分)。但如果B上有N个链接,则A只能得到B的PageRank得分的N分之一。

    我们可以用图表来阐述其工作原理。假设有四个网页A,B,C和D,它们相互链接,如表-1所示:

    表-1:链接前的PageRank得分

    表-2:链接后的PageRank得分

     假设这四个网页初始PageRank得分均为0。则根据上面的公式它们的PageRank得分都是0.15。我们计算一下链接后各自的PageRank得分情况。
    1.A链向B、C和D。A的初始PageRank得分是0.15,所以A的导出链接获得PageRank得分总数为 0.85 * 0.15 = 0.1275。B,C和D三个网页各得0.0425分。
    2.B链向C、B的初始PageRank得分也是0.15,所以其唯一链接页面C所能够获得的PageRank得分是0.85 * 0.15 = 0.1275分。
      C链向A,其0.1275的PageRank得分传递给唯一链接对象A。
      D链向C,其0.1275的PageRank得分传递给了C。
      现在各网页的PageRank得分结果如下:
      A:0.15 + 0.1275 (得自C) = 0.2775
      B:0.15 + 0.0425 (得自A) = 0.1925
      C:0.15 + 0.0425 (得自A) + 0.1275 (得自B) + 0.1275 (得自D) = 0.4475
      D:0.15 + 0.0425 (得自A) = 0.1925(如表-2所示)
    继续这样的计算,直到每个页面的数值逼近一个定值(PageRank属收敛函数)。最后可以发现,C的PageRank最高。而且外部链接的数量显著地改变了PageRank得的分布。
    表-3:最后的PageRank得分结果

    表-4:外部链接与PageRank得分对照表:

      导入链接 数量 导出链接 数量 最终PageRank得分 C A/B/D 3 A 1 1.4860614724 A C 1 B/C/D 3 1.4131522515 B A 1 C 1 0.5503931379 D A 1 C 1 0.5503931379

    十:PageRank的反馈性[出自chinaseo]
      
    PageRank的反馈机制说明了为什么一个网站的导出链接能够使网站自身受益。
    假设A页链向B,根据PageRank计算公式,其初始PageRank为0.15,链接后的PageRank变为1。如果A链向C,而C又链回A,则A此时的PageRank变成了1.4594594595。也就是说若A链向一个外部网页,而那个网页又回链向A的话,则使A的PageRank会增加。(如果A链向一个网页,而该网页又链向C,C再链向A的话,也会发生同样的情形)。如果把所有相互链接的页面看做是一个系统整体的话,其实链接前后系统总的PageRank并没有发生改变,只是由于不同链接关系的发生导致了PageRank对系统内每个链接页面的重新分布。

    表-6-1:无链接交换时:A到E页都是已被Google收录的页面。其中A和B是我们网站的内页

    表-7 未提供导出链接前 提供导出链接后 A的PageRank得分: 1 1.3599321536 B的PageRank得分: 1 0.7279711653 网站的PageRank总分: 2 2.0879033189

    其增量比较小,整体则视情况而定。但有一点是显而易见的 – 提供导出链接的网页往往会通过一种叫做PageRank反馈的机制提升了自身的PageRank。

    结论:
    这表明和一些大型站点进行互惠链接交换是比较明智的。这些大网站均采用链接结构,并对链接页给予高度关注。你所链接的对象站点所包含的网页数量及其设计结构对于你网站的PageRank反馈总数有着显著的影响。

    十一:如何控制PageRank
    虽然PageRank因子很难控制,但我们可以通过其它技术来得到理想的结果。而且,良好优化过的页面因子整合较高的PageRank得分无疑会使网站更具竞争力。

    PageRank因子的优化可从下面三个方面着手:
      1. 导入链接。包括如何选取导入链接,获得导入链接所付出的努力是与收获呈正比的。
      2. 导出链接。包括导出链接的选取及它们在你网站上的合适位置,应使PageRank得到最大回馈(Feedback) 和最小损耗(Leakage)。
      3. 网站内部导航结构和内部页面的联接。实现PageRank在网站内部的良好分布。

    十二:导入链接(Links to Your Site)
    寻找导入链接时,一般总是容易陷入这样的误区:只看链接页的PageRank得分,得分越高就越好。而事实上,一个链接页的PageRank得分遵循平均分配原则被平均分配给该页面上的所有链接。所以,只注重外部链接的PageRank得分的链接策略无疑是片面的。正确的做法应该是既要考虑链接页的PageRank,又要考虑该页的链接数量(应注意:PageRank的单位是网页而不是网站,即每个页面都有其特定的PageRank。所以在寻找链接时应查看“链接”页面的PageRank,也就是说,需要考虑的是放置你网站链接的那个页面的PageRank得分情况。) 而且PageRank较高的站点对链接请求一般总是比较挑剔的。

    结论:
      那些看起来较为适宜,具有良好质量的网站都是理想的链接对象。先别去管它们的PageRank到底是多少,倘若它们既与你的网站相关,又具有较高的质量,那么总是会有益你的PageRank,只是个时间问题罢了。另外,网站被dmoz和Yahoo收录亦能相当有效地提升PageRank。

    十三:导出链接(Links out of your site)
    导出链接并不会损失PageRank,但网站整体的PageRank将会降低。所以,选择导出链接时宜遵循这样的定律:
      1. 尽量保持自己网站的PageRank
      2. 尽量使内部页面分得尽可能多的PageRank

    向大家推荐一种方法:可以在网站上设立一个对导出链接的“评审”页。用于放置对外部链接站点的评审内容。每条评审内容应包括指向其相应外部站点的超链。(注意:由于搜索引擎的SPIDERS无法支持javascript,所以不宜用JAVA程序打开这些页面。)

    “评审”页应链回网站内部等级较高的一个页面 (最好是主页,其它重量级页也可)。这样做可显著降低网站PageRank的流失。放置外部链接的页面亦需链回主页及其它重要内部页面。但“评审”页上只要放置一个重量级内部页面即可(最好是主页)。此外,可以告诉你的”评审“链接对象你已经”评审“过他们的网站,这样一来他们很有可能会把你的这个”评审“页链接到他们自己的网站上,这样就可以从他们那里得到两个导入链接。自然效果就更好了。用文字描述太麻烦了,我们还是用图表来说明吧。(下表包括主页A,外部链接页页D和其它两个内页B和C)

    如果进行相同的计算,但包括review pages,则结果如下:
    表-9:加“评审”页后的各网页PageRank得分情况

    如果只看A,B,C和D页,则结果如下:

    无评审(Review)页 有评审(Review)页 主页的PageRank: 0.9536152797 2.439718935 B/C/D页的PageRank: 0.4201909959
    0.4201909959
    0.4201909959 0.8412536982
    0.8412536982
    0.8412536982 PageRank总计: 2.2141882674 4.9634800296

    在放置导出链接的页面上同时放一些网站的内部链接是提高PageRank的相当重要的内部因素之一。这种收益虽然无法和网站所从导入链接上获得的收益相提并论,但却极易操作,并可有益于网站读者。

    十四:网站的内部结构和联接

    一:网站的内部页面
    说完了“外部链接”,现在让我们来看看“内部链接”。如果PageRank确由页面投票的质量和数量所决定,那么我们立即就可以得出网站内链与PageRank的关系的一个重要结论:

    网站上每个已被Google收录的内部网页(内链)都是对该网站的一记投票,不过投票份量很小。因而,一个网站若能拥有更多已被Google收录的内部网页,就有可能获得更多的总投票。

    这样一来,我们可以通过创建大量内部网页来提高网站整体的PageRank。但这还远远不够。因为我们此处所指的内部网页是指已被Google收录,即拥有自己的PageRank的那些内链页面。这些网页之所以被Google检索是由于它们具备丰富充实的内容。所以应尽力充实和丰富你的网站,一旦网站内容得到充实和丰富,会有更多的内页得到检索,从而带来更多的PageRank。同时“升值”的网站也会获得更多站点的青睐,从而会有更多的站点主动链接你。

    简言之,就提升PageRank而言,对“内”最需要做的就是为网站填充更加丰富和有价值的内容。应确保网页内容不会过长或过短,如有必要可将网页内容分割成若干网页。

    二:网站的内部结构&联接
    网站有三种内部联方式,宜结合使用这三种联接方式进行网站的建设。假设一个网站由“主页”,“关于我们”页,“产品介绍”页和“更多信息”页这四个页面组成,通过下表我们可以看出每种结构对网站PageRank的影响度。

    表-11:层级结构(Hierarchical)

    表-12:环路网站结构(Looping)

    表-13:内页广泛互联的网站结构(Extensive Interlinking)

    表14-16是内部页面在不同结构网站上的PageRank分布情况。了解了这一点我们就可以从“内部链接”着手来获得最大的PageRank反馈。

    表-14:层级结构的PageRank分布(总PageRank=4)
     
    表-15: 环路结构的PageRank分布(总PageRank=4)

    表-16:内页广泛互联结构的PageRank分布(总PageRank=4)

    在未考虑外部链接因素的前提下,可以看出类层级结构(Hierarchical-Like)能够改变网站内部页面的PageRank分布。(注意:我们所指的并不一定是严格意义上的层级结构,不过必须比环路结构(Looping)或广泛互联(Extensive Interlinking)结构包含更多层级结构的属性。)

    若PageRank均匀分布于网站内部页中,那么网站管理员可以通过层级结构这种能够使PageRank发生转移的性能来有选择地转移内部网页的PageRank:即把一些不太重要的页面的PageRank适当地转移到那些关键词竞争性比较强的网页上,或想提高特定关键词排名的网页上去,从而使网站获得最大的收益。

    上面只是封闭网站设计结构(即无导入也无导出链接的结构)下内部各网页的分布情况,如果加入外部链接--即导入和导出链接后情况又会怎样呢?如表17-19所示:

    表-17:非封闭层级网站结构的PageRank分布

    表-18:非封闭环路网站结构的PageRank分布

    表-19:非封闭内页广泛互联网站结构的PageRank分布

    无导入/导出链接PageRank分布 有无导入/导出链接PageRank分布 网站结构 主页的PR 其它各页的PR PR总数 主页PR 其它各页PR PR总数 层级 1.9189189189 0.6936936937
    0.6936936937
    0.6936936937 4 1.49842 0.57455
    0.57455
    0.57455 3.222094 环路 1 1
    1
    1 4 0.68369 0.73113
    0.47787
    0.77146 2.664173 广泛互联 1 1
    1
    1 4 0.95411 0.85476
    0.85476
    0.90469 3.568342 结论: 内页广泛互联(Extensive Interlinking)的网站结构(表13)可以最大程度地保留一个网站内部的PageRank,其次是层级(Hierarchical)结构(表11),最后才是环路(Looping)的网站结构(表12)。 注意: 理论上是这样,但实际上如果让上万个内部网页互联起来又不太可能。所以还必须为网站各分枝选择合适的结构。不过对层级结构来说,越是增加子页数量效果越好。这是由于在导出链接页上增加了更多内部链接,按照PageRank平均分配给所有内/外链接的原则,受益最多的还是你。不过,如果增加太多内页,也会明显影响主页的PageRank。

    十五:Google如是说
    关于PageRank,最权威的发言人自然还是Google。虽然Google不会也不可能提供相关的技术信息,但我们亦可从中窥得一斑
    Chris:PageRank的命名是基于“Page”,还是和某个创始人有关?
    Google:PageRank是以Google的联合创始人兼总裁Larry Page的名字命名的。
    Chris:Google是否把PageRank视做显著区别于其它搜索引擎的一个特性?
    Google:PageRank是一种能够使Google在搜索速度和搜索结果的相关性上区别于其它搜索引擎的技术。不唯如此,在排名公式中Google还使用了100种其它的算法。
    Chris:Google是否认为引入PageRank可以显著提高搜索结果的质量?以后是否仍将继续使用PageRank?
    Google:由于PageRank使用了量化方法来分析链接,所以它仍将是决定Google搜索结果页排名的一个重要因素。
    Chris:您认为Google工具栏上的PageRank的信息对普通用户/网站管理员/搜索引擎优化专家来说各有什么意义?
    Google:Google工具栏上所提供的PageRank信息仅作为一种网站评估信息使用。用户们会觉得它很有趣,网站管理员一般用它来衡量网站性能。不过,由于PageRank只是一个大体评估,所以对搜索引擎专家的价值并不大。
    Chris:常有网站试图通过“链接工厂”和访客簿的手段达到提升PageRank的目的。对这样的网站Google有什么举措?
    Google:Google的工程师会经常更新Google的排名算法以防止对Google排名的恶意操纵。

    结束语:
    选择导入链接时应首先考虑对方网站的内容如何,然后再考察其导出链接的数量进行决策。而在建立本站的导出链接时则应尽量使自己网站的PageRank维持在最大回馈和最小流失上。

    应确保合理的网站设计结构和内部联接方式。网站的结构和内部联接方式也会对PageRank产生影响,可利用其特性有效进行PagaRank在网站内部页面的再分布及尽可能保持网站整体的PageRank。

    网站的PageRank的提升应与该网站的访问者体验息息相关。即使获得再高的PageRank,如果没有客户访问,一样毫无价值。所以网站的内容始终是提升PageRank最关键的因素之一。

  • [CuteSEO网络营销管理顾问]

    上一篇:Google将加强整治spam
    下一篇:Google--PageRank(网页级别)技术解密(一)


    Google比百度来的效果要快Google帝国时代即将来临
    Google惩罚自家网站,起因付费链接全世界都在支持Google
    搜索引擎优化研究网揭开Google优化最简单四个步骤Google Pagerank值升降的一些误区
    Google专利:怎样鉴别和处理垃圾链接怎样优化不同国家的Google排名
    网站优化知识手册:Google惩罚篇网站优化知识手册:Google Pagerank篇
    搜索引擎三巨头之争 Google凭借两项改进胜出Google医疗广告最新政策
    让图片检索结果在Google图片搜索排前列Google与Baidu的优化异同之处

    【关键词:Google

    网站推荐 Recommended
    最新文章 News