获取google pagerank值的研究
专业网站搜索引擎优化及Google排名优化服务

获取google pagerank值的研究


http://www.cuteseo.cn  CuteSEO  搜索引擎优化  2008-3-13  《获取google pagerank值的研究》相关文章  

 今天在网上看到有网站提供显示google pagerank值的功能,听说Google已经取消了公开的pagerank显

示,只有通过ie Google toolbar获得,所以觉得挺有意思,就去研究了一下。

  我装上Google toolbar抓了一下socket包,得到了如下信息:

  GET /search?client=navclient-auto&Googleip=O;3812&ch=62544423920&freshness_check=

  4X0lThsX1_WR7cBSIbnl8&ie=UTF-8&oe=UTF-8&features=Rank&q=info:

  http%3A%2F%2Fblog%2Eiyi%2Ecn%2Fdavid%2F HTTP/1.1

  User-Agent: Mozilla/4.0 (compatible; GoogleToolbar 2.0.114.9-big; Windows 5.2)

  Host: toolbarqueries.Google.com

  Cache-Control: no-cache

  Cookie:

PREF=ID=3e46a681346bcce2:NW=1:TM=1099618786:LM=1104831026:TB=2:S=8oMV8rWWHE07ngDp

  

  测试了一下,发现只有GET后面的信息和host比较重要,其他的信息可以任意填写

  而这其中比较重要的信息是下面这几条:

  

  client=navclient-auto&

  ch=0123456789&

  features=Rank&

  q=info:http%3A%2F%2Fblog%2Eiyi%2Ecn%2Fdavid%2F

  

  client=navclient-auto表示客户端是google toolbar,如果没有这个参数得到的结果是在Google中

搜索这个网址的结果

  ch=0123456789是checksum值网站优化服务,关键中的关键,Google对每个网址用特殊算法进行转换后得到这个

checksum,Google就是靠这个来对它的pagerank进行"加密"的。如果知道了这个算法,获取pagerank就

轻而易举了。

  features=Rank获取的是pagerank值,我得到的结果是Rank_1:1:1其中最后一位是pagerank的值,如

果忽略这个参数得到的是相关网页在Google中的详细信息的xml,我得到的是下面的信息:

  

  

  

  -

  0.124300

  info:http://blog.iyi.cn/david/

  

  

  

  

  -

  1

  

  -

  http://blog.iyi.cn/david/

  http://blog.iyi.cn/david/

  泰然处之- 大卫's BLOG

  1

  泰然处之 - 大卫's BLOG. 2004年12月. 日, 一, 二, 三, 四, 五, 六. 1, 2, 3, 4.

...

  zh-CN

  -

  

  

  

  

  

  

  
  

  内容很容易看得明白,这里就不解释了。(难道我得blog被Google惩罚了?好久没有更新了-_-)

  知道了原理,就来考虑如何解决了。其实Google toolbar可以很容易的动态跟踪,懂得汇编的人可

以很快的找出它的checksum算法,这当然是最好的解决之道。

  另外,如果你不懂得汇编,可以通过历史纪录获得向管链接的checksum值,可以从你的ie临时文件

夹中找到。

  或者你也可以建立代理服务器,让Google toolbar通过代理服务器来获取pagerank值,然后在代理

服务器上运行相关程序来截取checksum值。

  另外,还找到这个pr值对照表:

  

  Toolbar PageRank Real PageRank

  0/10        0.15 - 0.9

  1/10        0.9 - 5.4

  2/10        5.4 - 32.4

  3/10        32.4 - 194.4

  4/10        194.4 - 1,166.4

  5/10        1,166.4 - 6,998.4

  6/10        6,998.4 - 41,990.4

  7/10        41,990.4 - 251,942.4

  8/10        251,942.4 - 1,511,654.4

  9/10        1,511,654.4 - 9,069,926.4

  10/10       9,069,926.4 - 0.85 × N + 0.15

  

  我觉得所谓的real pagerank可以估算为:Nd+(1-d)

  N是在google搜索到的链接到当前网页的网页数,d是Google定义的阻尼值。

  比如在Google中输入link:www.sohu.com得到的结果是:133,000 项,用上面的公式计算得到

113050.15,刚好对应到pr值7,也可以根据各个数据段的百分比算出10以内的pr值小数位

  其实这样子很容易的到pr值,根本不用那个checksum加密算法.
[CuteSEO网络营销管理顾问]

上一篇:探讨Google的筛滤工具(Filters)及如何规避
下一篇:导出链接在Google搜索注册中的作用


Google Pagerank值升降的一些误区网站优化知识手册:Google Pagerank篇
Google PageRank研究的一些结论Google官方对PageRank数字的定义
Google Pagerank预测论页面等级(PageRank)是否存在渗漏损失问题
Google(Pagerank)专利技术概述PageRank是否已成昔日骄子
Google表态PageRank仅供娱乐?谈PageRank-Google的表决式网页排名技术
Google--PageRank(网页级别)技术解密(二)PageRank,网页排名,又称网页级别、Google左侧排名或佩奇排名。
Google表态 PageRank仅供娱乐?百度优化篇——百度pagerank揭密

【关键词:pagerank

网站推荐 Recommended
最新文章 News