搜索引擎正在快速地发展,个性化趋势是搜索引擎的一个未来发展的重要特征和必然趋势之一,因此也一直以来都是业界领袖们各自展现智慧的领域。
一种方式通过搜索引擎的社区化产品(即对注册用户提供服务)的方式来组织个人信息,然后在搜索引擎基础信息库的检索中引入个人因素进行分析,获得针对个人不同的搜索结果。自2004年10月yahoo推出myweb测试版,到11月a9推出个性化功能,到2005年Google search history基本上都沿着一条路子走,分析特定用户的搜索需求限定的范围,然后按照用户需求范围扩展到互联网上其他的同类网站给出最相关的结果。
另外一种是针对大众化的, Google个性化搜索引擎,或者yahoo MindSet,或者我们都知道的前台聚类的vivisimo.但是无论其中的哪一种实现方式,即Google的主动选择搜索范围,还是yahoo,vivisimo的在结果中重新组织自己需要的信息,都是一种实验或者创想,短期内无法成为主流的搜索引擎应用产品。
对于向注册用户实现个性化搜索的模式一般是通过各种渠道收集个人信息,包括各种tool bar ,各种软件客户端,注册信息,搜索query历史,搜索点击历史,甚至本地访问记录,本地文件扫描等等,如filangy,然后再用户搜索的时候搜索引擎在处理基础数据时会附加这些个人特征信息,以便能方便的提供针对你的需要的信息。但是这方面目前还没有特别成功的案例。
另外就是象大众提供个性化搜索服务的,那它往往是通过cookie,ip地址等,附加信息,或者要求用户主动选择搜索范围(如Google personalized),或者被动选择搜索特征或者范围(Yahoo!mindset ,vivisimo)当然目前这方面也没有成功的案例。
但是如果能把两者结果起来则是一个很有前途的实现模式,也会影响到搜索引擎营销(SEM)等商务模式。
另外提一个搜索引擎,可能不是很受大家关注,Rollyo(ttp://www.rollyo.com/)一个提供个性化可定制搜索引擎服务。通过Rollyo, 你既可以从其提供的几十个搜索来源中选择哪些显示在搜索页面上面,也可以通过Rollyo提供的自定义功能,创建自己的定制搜索。此外,Rollyo还提供了一些实用的功能,如Firefox的插件(你可以将自定义的搜索加入到Firefox中,方便使用),RollBar书签功能(你用书签保存之后,以后你就能直接在这些书签网页中直接进行搜索),还提供了社会化的分享功能(需注册)。
Google的研究和改善得到了广泛评论,其中一个担心是Google某些个性化功能,但需要登陆才能使用。很多用户理所当然地不情愿这样做,因为这样可能会给Google提供追踪其特殊的搜索内容的条件。 Jhn Battelle也认为这个想法有点可怕,尽管Google的Matt Cutts并不同意这个看法。所需要的就是一种虽然是匿名方式,但能提供个性化的搜索方式。从更广泛的角度来说,提供多个网站上的个性化会更加有用。 Collarity就是拥有这一功能的搜索引擎。
Google新的个性化搜索引擎打算通过对搜索结果进行重大的改变,吸引更多的用户使用这项服务。用户可以让搜索引擎只搜索特定的话题,并且将搜索结果限制在几个特定的网站,或者仅对某个站点进行搜索。用户还可以用标签来标注某个网站或搜索结果,将它与其它的结果聚合起来,组成一个更精确的搜索结果列表,并可以在搜索结果中分享来自内容广告方面的收入。另一个功能则是企业将搜索引擎用于企业自身网站的内部搜索引擎。
而这一新改变可以解决目前搜索市场所面对的两大核心问题。首先是不明确性。比如用户搜索WPF,可能会搜索出World Puzzle Federation,或者是Windows Presentation Foundation,如果后者是我所需的,那么搜索引擎应该通过编程设定帮我将这些内容过滤出来。另一个问题是,互联网上充满了那些只为了追求广告点击而存在的垃圾网站和blog。而采用可定制的白名单的方式可以过滤掉这些网站。
而它的不足之处在于,人们需要时间来找到或配置这样一个合适的个性化搜索引擎。目前我们中的大部分人在搜索时,都会直接将搜索内容输入Google,然后点击搜索按钮,再在一大堆不相干的结果中查找自己所需的内容。而个性化搜索引擎则可以在一定程度上将客户不需要的内容自动过滤掉。
从理论上讲,与Google的个性化搜索引擎相比,解决以上问题的另一个更好的方法就是使用语意网。语意网可以让网站或者任何在线数据库使用RDF对其所包含的内容进行解释。
惠普的研发实验室对于语意网有着长期深入的研究,他们开发的免费Jena图书馆RDF程序已经被下载了超过12.5万次。惠普实验室的语意网研发经理Martin Merry表示:“我们一直在推动语意网走向实际。虽然很多人都期待能够体验到语意网技术,但是目前还没有可以大规模实际应用的产品。”
虽然Merry认为目前谈论语意网实际应用还不成熟,但是他仍然表示“一些企业的部门已经开始使用RDF技术了”。
真正的语意网的强大程度远远超过目前的互联网,它不但可以应用于搜索引擎,还可以用于任何数据的融合和聚合。而Google则是通过采用先进算法对搜索引擎结果进行处理,这种方法要比引入语意网概念更容易被用户接受,实现起来也更简单快捷。这其实是一种自下而上的进化,比如标签、微格式(microformat),以及RSS,他们可以说都与RDF同源。而那种自上而下的方式,说服企业和机构都开始发布符合RDF标准的数据,则颇有难度。因此,语意网的发展还有很长的路要走。
随着搜索引擎技术的快速发展,个性化的讨论和研究不仅不会停止,以上这些观点是讨论的一部分。不管如何,搜索引擎个性化的趋势是不变的,相信许多研究成果会很快变成现实。

