“HillTop”论 - 探索Google排名新算法3
专业网站搜索引擎优化及Google排名优化服务

“HillTop”论 - 探索Google排名新算法3


http://www.cuteseo.cn  CuteSEO  Google优化    2008-3-13  《“HillTop”论 - 探索Google排名新算法3》相关文章    更多推荐文章

3.对Hilltop算法的分析和推测

3.1 为什么采用新算法

大多数网迷们都知道,页面等级算法是由Google的创始人Sergey Brin和Larry Page所倡起的,用以精良网站在搜索结果中的排名。这也是自1998年Google发布以来的取得种种骄人成绩的重要因素之一。

但页面等级系统亦存在着一个基本的缺陷,Google也深知这一点。它根据一个网页上被链接的站点数量和质量来给该网页分配一个绝对的"重要性值"。同时亦将链接页面的页面等级考虑在内。指向一个网页的外部链接页的页面等级越高,则该链接页面传递给该网页的页面等级值也就越高。但是,"页面等级值"并非针对查询词语,因而一个网页即使只是在内容中偶然提到了一个和查询主题偏离的关键词语,也会因其居高的页面等级值而获得一个比较高的排名。

美国加州的克利须那。伯哈拉特(Krishna Bharat) 意识到基于页面等级的排名系统中所存在的这种瑕玼,并于2000年提出了一种新算法网站优化服务,他称其为"Hilltop"算法,并于2001年的一月份申请了Hilltop专利权,Google成为受让方。不言而喻,Google已然意识到这种新算法与其页面等级系统的整合将为Google的排名系统带来良好的效果。

我深信,在Google最近的更新中,不但运用了Google自身的页面等级和相关性算法,而且还结合使用了Hilltop算法用于精工调整页面等级的效果,只不过Hilltop算法可能已迥异于它最初的模样了。

3.2 什么是Hilltop算法?

对此算法有兴趣了解并想挖根究底的人可以看看克利须那。伯哈拉特当年所写的Hilltop论文及详细的Hilltop专利信息。但对我们大多数人来说,只要知道Hilltop算法到底是个什么东东就可以了。简单地说,页面等级决定一个网页的"权威性",而Hilltop(LocalScore)则决定匹配一查询条件的一个网页的"权威性"。

Bharat提出:在利用"页面等级"来寻找"权威"网页时,不应单纯依赖于值的大小来定夺,而应将重点放在它与查询主题的相关性上; 即不但需要考虑网页的页面等级,还要考虑该网页的页面等级与查询主题的相关性是否相称。若一个网页只与查询主题只沾点边,那么即使其页面等级非常之高,对用户来说也是没有意义的。如此一来,于网页而言,那些来自于"相关主题"的文档的链接就更有意义了 (Bharat称这种"相关主题"文档为"专家文档"),一个网页的所有外部"专家文档"链接构成了该网页的"权威性值"。Hilltop算法的意义在于:相同主题网站之间的链接应比非相关网站的链接具有更高的价值。

Hilltop算法以如下方式计算一个网页的"权威值"(这只是极为简单的一个例子):

  • 以该关键词进行一次普通查询找专家文档"文集"。"专家文档"的定义有严格标准,因该"文集"应是数量上易于管理的一组网页。
  • 从返回的专家列表中把成员站点(见下注解*)和镜象站点去掉。
  • 根据所获得的上述专家文档对其投票的数量和质量,网页被分配以一个“局部分数”(LocalScore)。然后按网页的“局部分数”进行排名。
      *注解:成员站点指来自同一个域,或域相同而后缀不同的站点,如ibm.com,ibm.co.uk,ibm.co.jp等等,或指来自相邻的IP地址的站点 (前三位IP地址相同,形如64.129.220.xxx)

此外,若两个站点均为相同IP地址下的宿主,则认为其中一个是另外一个站点的成员站点。(即:若ww.abc.com和www.ibm.com均为相同IP地址下的宿主,则认为www.abc.com是www.ibm.co.uk的成员站点)

Hilltop算法的一个极其重要的特征在于:若没有找到搜索引擎认为数量足够的“专家文件”(要求至少需有两票),则该算法失效,即返回结果为零。换言之,对于高度明确化的查询条件(查询词语),Hilltop算法的结果很可能为“0”。这是该算法的一个独特特性。如此一来,造成了SEO搜索引擎优化一族中的大部分人都深信Google的确在用“商业词”过滤名单来过滤掉商业网站。

事实上,在Hilltop算法无法奏效时,将显示“旧”Google的搜索结果。这些查询条件的集合就是SEO搜索引擎优化一族所收集并称之为的“商业词名单”。这一效果无意中却提供了一个强有力的证据,表明Google确是采用了Hilltop算法。2003年11月15号,Google基于新算法的更新之后, 某分析家就指出:在进行查询时,若对某一查询条件加上一些“不包含”的无意义字符,如“car rental – ghjkl”,则Google将会显示以往(算法变化前)的搜索结果,而绕过所谓的“商业词”过滤名单。

例如,若查找“real estate –hdfkdhgk”,则Google将试图返回所有关于“real estate”,同时内容中又不包含“hdfkdhgk”的页面。又由于包含“hdfkdhgk” 这种字眼的网页几乎没有,所以按道理来讲,Google返回的查询结果应该和“real estate”的查询结果是相同的。然而结果却出人意料:Google所显示的查询结果和采用新算法之前的搜索结果的排名是相同的。事实上,Scroogle.org这个网站就是捕捉Google的搜索结果在排名上的不同,并以此得出一个所谓的“商业词”过滤名单。

上一页   下一页[CuteSEO网络营销管理顾问]

上一篇:“HillTop”论 - 探索Google排名新算法4
下一篇:“HillTop”论 - 探索Google排名新算法2


百度算法改变的说明最近一个星期做搜索引擎优化其实不单单考虑搜索引擎的算法
浅谈百度搜索引擎排名算法调整的新动向2009百度权重算法的改变
Google优化算法的改变谷歌算法大变,内容权重更高
Google排名算法异动:大品牌排名全面提升谷歌算法变化万千,做SEO的朋友更是紧促
谷歌广告排名新算法:质量将扮演更重要角色4因素决定排名算法90%的内容
Google的算法改变了“HillTop”论 - 探索Google排名新算法5
“HillTop”论 - 探索Google排名新算法6如何领先于Google排名的算法

【关键词:算法

网站推荐 Recommended
最新文章 News