• 1
  • 2
  • 3
  • 4

Yahoo! 目录和Yahoo! 搜索

发表时间:2009-4-8 19:12:21   文章归类:雅虎优化

   Yahoo! 目录和Yahoo! 搜索是完全二个独立的事物。那目录是一个人工分类的网站集合。Yahoo! 搜索是被Yahoo 购买的各种不同的搜索技术的有效组合!。Yahoo! 每天搜索服务超过一亿次,目录可能最高每天不超过一百万搜索量。Yahoo! 搜索使用不同组合的技术是AltaVista 、AllTheWeb 和Inktomi。他们开始了新的Yahoo! 搜索产品时,他们重写了Inktomi 的核心技术在比较长的搜索短语查询更容易更新并且改善了它的关联,Yahoo! 搜索也正在提高垃圾网页过滤器的能力!


Yahoo! 搜索索引被共享:


Yahoo! 搜索索引也被AltaVista 和AllTheWeb 和另外地搜索引擎调用。每一个搜索网站可能仍然使用他们自己的运算法则再来组织来自共同的搜索索引的搜索结果。


搜索引擎Yahoo 的分类体系及性能评价

目前很多的搜索引擎都是将人工编制的等级式主题目录和计算机检索软件提供的关键词等检索手段结合起来,完成网络信息资源的组织任务。Yahoo就是这种等级式主题指南类搜索引擎的典型代表。Yahoo的魅力就在于它的可浏览式等级主题索引。按照主题建立分类索引,提供全面的分类体系结构,并结合高质量的检索软件,Yahoo成功地建立起了一套独特的信息管理和组织机制,使得对网络信息的全面检索变成现实。现对Yahoo
的类目体系、分类原理、检索方式、性能评价等作进一步的探讨。


一、类目体系


Yahoo由14个基本大类组成,包括Art&Humanities(艺术与人文)、Business&Economy(商业与经济)、Computers&Internet(电脑与网际网路/网络)、Education(教育)、Entertainment(娱乐)、Government(政府)、Health(健康与医药)、News&Media(新闻与媒体)、Recreation&Sports(休闲与运动)、Reference(参考资料)、Regional(国家与地区)、Science(科学)、SocialScience(社会科学)、Society&Culture(社会与文化)。

根据其拥有的信息或网站的多寡及知识组织的需要程度,每一个基本类目下细分不同层次的次类目或子类目,愈往下的子类目中的网站其主题愈特定。它建立了一个由类目、子类目等构成的可供浏览的相当详尽的目录等级结构。其类目设计合理,结构完整、全面,类目等级层次鲜明,各级详略、宽泛程度不一,从而为网上丰富的信息资源的归类,尤其是确切归类提供了基础。


二、分类原理


InternetScoutProject的分类专家AimeeGlassel认为,“印度著名分类专家和图书馆专家阮岗纳赞的冒号分类法理论体系与Yahoo网络信息资源的主体目录之间存在着密切的联系”,从而揭示了Yahoo应用分面分析方法进行网络信息资源的分类实质。具体说来,可从以下几点来深入地理解Yahoo的分面分类原理或基本过程。


1.采用宽泛的主题领域建立分类索引


为了使其分类体系既具有无限的容纳性,又具有相当的专指性,Yahoo采用较为宽泛的主题领域,通过分析兼综合的方法建立较为完整的分类索引。这与分面分类的思想不谋而合,因为将知识分为宽泛的类目即分面,多方面地反映主题内容以避免列举式类表的线性单向式的结构正是阮岗纳赞冒号分类法的主要原则所在。


2.根据上下文进行信息内容的组合


从Yahoo的分类结构外表看,也许会认为它与叙词表很相近,因为Yahoo也是使用词汇而非符号来组成相应的概念词串。但是,从组合类目的能力看,它远远比普通的叙词表复杂得多。通过分析Web页面的内容特征,得到由Yahoo分类体系结构中某些类目词组成的概念词串或标引词串,将其放入相应的类目层次中。在Yahoo的概念词串或检索词串中包含的独立的词汇都含有自身的名字,但是一旦与其它词组合,则产生了一个上下文关系,拥有了一深层次的涵义。从这一点上说来,与分面分类法也是极为相似的。


3.利用冒号标记信息内容


现以“20世纪60年代印度在肺结核治疗方面的研究”作为待分类标引的信息内容来具体考察两者的标记制度:在阮岗纳赞的冒号分类法中,该内容标引为:L,45;421;6;253;f.44‘N5
用词代替相应的符号,则为:
Medicine,Lungs;Tuberculosis:Treatment;X-ray:Research.India‘1950。
如果将分面公式中的相应标点符号用冒号代替,由此所形成的字符串形式就是在Yahoo中用于描述信息内容的方法,相应地表示为:
Health:DiseasesandConditions:Tuberculosis

可见两者在信息描述上何其相似!Yahoo利用冒号作为统一的分隔符进行了信息内容的组织和描述,既保留了原先的分面标记的特点,又在一定程度上简化了标记制度,从而极大地提高了信息分类标引的效率。


4.提供不同的分类路径入口


“虚拟的信息集合”是Yahoo的一大优点,体现在其拥有的概念模式和引用次序(即分面排列次序)的灵活性上。在传统的图书馆中,一本书只能放在书架的某一固定位置上。但在数字化的世界里,电子信息资源却不用再限制在唯一的物理位置上。我们可以将某一信息源分到类目结构的不同位置上。通过将分面分析方法应用到网络信息资源的组织中,Yahoo能够为某一信息源在其巨大的分类等级结构中提供不同的路径分支入口,这样就使其能够从不同的路径,为检索相同内容的不同用户提供服务,从而完成查询。


例如,现欲查找美国Wisconsin-Madison大学所在的网页,Yahoo就能提供如下几种分类或检索路径:


(1)若从Regional:类目入手,则相应的分类路径为:
Regional:U.S.States:Wisconsin:Cities:Madison:Education:CollegesandUni
versities:
UniversityofWisconsin-Madison。


(2)若从Education类目入手,开始的几级路径为:
Education:HigherEducation:CollegesandUniversities在
CollegesandUniversities目录下选择地理区域的子类目“UnitedStates@”后,
可以看到,又返回到Regional目录下,之后就与上述路径相同了。其中的奥妙就在于符号“@”的运用,它提供类似于相关参照(crossreference)的作用,能够指引用户由某一子类目进入Yahoo的浏览性等级结构的其它分支中。


  本文系原创文章,版权归为深圳网站优化所有,原文请查看链接地址http://www.baidu-seo.net.cn/yahoo-seo/329/,转载必须带上此地址,并标明原始出处,否则将追究法律责任。

Tags: 雅虎介绍   Yahoo介绍  

©2007-2021 龙阳网络(www.baidu-seo.net.cn) 版权所有 闽ICP备14017888号-2