• 入门知识:搜索引擎网页重要程度的计算介绍

  •        搜索引擎返回给用户的,是一个和用户查询相关的结果列表。列表中条目的顺序是很重要的一个问题。由于面对各种各样的用户,加之查询的自然语言风格,对同样的q0返回相同的列表肯定是不能使所有提交q0的用户都满意的(或者都达到最高的满意度) 。

         因此搜索引擎实际上追求的是一种统计意义上的满意。人们认为Google目前比天网好,是因为在多数情况下前者返回的内容要更符合用户的需要,而不是所有情况下都如此。如何对查询结果进行排序有很多因素需要考虑,后面将有深入的讨论。这里只是概要解释在预处理阶段可能形成的所谓“重要性”因素。顾名思义,既然是在预处理阶段形成的,就是和用户查询无关的。如何讲一篇网页比另外一篇网页重要?人们参照科技文献重要性的评估方式,核心想法就是“被引用多的就是重要的” 。 “引用”这个概念恰好可以通过HTML超链在网页之间体现得非常好,作为Google创立核心技术的PageRank就是这种思路的成功体现。

      除此以外,人们还注意到网页和文献的不同特点,即一些网页主要是大量对外的链接,其本身基本没有一个明确的主题内容,而另外有些网页则被大量的其他网页链接。从某种意义上讲,这形成了一种对偶的关系,这种关系使得人们可以在网页上建立另外一种重要性指标。这些指标有的可以在预处理阶段计算,有的则要在查询阶段计算,但都是作为在查询服务阶段最终形成结果排序的部分参数。

       本文系原创文章,版权归为深圳SEO所有,原文请查看链接地址http://www.baidu-seo.net.cn/SEO-Start/359/,转载必须带上此地址,并标明原始出处,否则将追究法律责任。
    Tags: 搜索引擎  
  • 发表评论:

    ◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

©2009深圳SEO版权所有.网站地图|网站导航标签汇总|粤ICP备09094894号