• 1
  • 2
  • 3
  • 4

学SEO必读-《搜索引擎-原理、技术与系统》

发表时间:2010-1-19 4:32:40   文章归类:seo教程

      要深入学习SEO,而不囿于肤浅的认识,就要深入的研究搜索引擎,本书详细的讲解了搜索引擎的原理、技术与系统。本书的作者已被百度请过去当高级工程师,专攻搜索引擎研究,由此可知本书的实用价值,国内著名SEO大家-大地,据说受过此书重大的启发,开发出一系列的SEO理论,如下:

大地这几年给国内SEO的贡献(贡献不等于全部公开,研究出来加以利用,对客户,对行业也是贡献的一种样式……):

一,开发了关键词分类的技术。

使得优化更加有针对性。


 

二,开发了递归值的计算规则。

使得链接的权重有了很好的解释。


 

三,开发了词根的概念。

奠定了优化的基础。


 

四,开发了组合的概念。

应用于优化,而且效果非凡。


 

五,开发了影子系统。

确定了采集来的文档的优化规则。


 

六,开发了沿用贝叶斯节点理论的链接聚合爆破法。

使得可以有效的控制任何页面的权重传递。


 

七,开发了优化中多入口计算规则。

可以打造一个页面的多个主题排名。


 

八,开发了排名计算的二叶模型。

使得客户体验和优化以及排名关联了起来。


 

九,开发并编写出了计算语义相关的粗略公式。

基本可以获得一个页面的语义权重累计值,在实践中计算后,感觉还有些意思,不过还需要完善。


 

十,开发出了个关键词提取软件。

基本有65%~70%的准确率(由于情况不等或者还低些)。针对某个页面可以达到提取的关键词和搜索计算的基本吻合。


 

十一,研究出了百度图片的排序原理。

可以按照不同的办法,采用四种做法处理几乎所有的百度的图片索引的排名。

排名的确定率不自夸的说可以在90%以上。


 

十二,在梅东的技术支持下,写出了查询语义相关性的工具,虽然目前语音检索还不是搜索的主流。但是在优化时也有一些实际的参考意义。


 

十三,分析完善了搜索引擎收录下载页面的补充数据库的原理。


 

十四,利用客户的检索行为,借助贝叶斯原理,开发出了网页信任度指数计算模型。

 

看完本书,能了解的搜索引擎模型计算如下:

基于布尔模型的计算:

实际布尔模型就是0和1的数值计算,查全率高但是准确率底。

基于向量模型的计算:

借助向量,计算出每个关键词的针对向量的相关性。对客户查询的准确有很大的提升。
其中tf-idf的计算,基于相对词频的归一化的词频,主要就是该算法。

基于概率模型的计算:

基本思想:给定一个用户的查询字符串,相对于该字符串存在一个包含所有相关文档的集合。我们把这样的集合看作是一个理想的结果文档集,能很容易得到结果的文档。这样就可以把查询处理看作是对理想结果文档的集属性的处理。

基于贝叶斯定律的计算:

            p(dj|r)*p(r)
sim(dj,q)=  ------------
                 -    -
            p(dj|r)*p(r)  

广义的向量空间模型:

索引词向量是线性独立而不是两两相交的。在广义向量模型中,两个关键词向量可能不是正交的,这就说明索引词向量不能看成是向量空间的正交基向量,相反是由更小的分量组成。

神经网络模型:

人工神经网络是对人脑或者自然神经网络若干特性的抽象和模拟。主要以大脑的生理研究成果为基础,目的在于模拟大脑的某些机理和机制,实现某个方面的功能。

人体的神经元由细胞体,树突,轴突三部分组成。

推理网络模型:

这是建立在贝叶斯可信度网络理论基础之上的一种新型检索模型。

信任度网络模型:

基于贝叶斯网络理论的另一个检索模型是信任度网络模型。

下载地址:http://www.baidu-seo.net.cn/upload/2010/1/搜索引擎-原理、技术与系统.pdf
 


  本文系原创文章,版权归为深圳网站优化所有,原文请查看链接地址http://www.baidu-seo.net.cn/seodownload/613/,转载必须带上此地址,并标明原始出处,否则将追究法律责任。

Tags: 学SEO   seo教程   SEO教程下载  

©2007-2021 龙阳网络(www.baidu-seo.net.cn) 版权所有 闽ICP备14017888号-2