20 Dec 2007Google是怎样判断网页搜索结果质量的?
互联网上有超过一亿个网站,网页则更多。作为世界上最大的搜索引擎,Google是怎样知道某个关键词所返回的搜索结果里,哪些才是好的呢?要知道,这个判断过程是至关重要的,它决定了一个搜索引擎的优劣,好的搜索引擎总是能将最好的搜索结果放在最前面。我们都知道Google有独家的PageRank算法,但除了这个法宝外,Google还有什么手段去判断网页搜索结果的质量呢?
Google的调研主管Peter Norvig在一次采访中透露了一些相关的信息。首先,其中一种办法是用系统监测搜索用户所点击的内容。如果用户点击了第一个结果,那很可能意味着该结果就是他们想要的,是最佳结果;反之如果用户跳过继续一页又一页地翻下去,或改变查询内容,那么Google就可知道这些结果并非用户想要的。其次,Google会随机抽取一些特定的搜索查询,然后雇用人员去评价这些搜索查询的质量。这些被雇用的人员只是Google的合约工,Google会首先对他们进行培训,教会他们分辨spam及各种不良网站,然后再记录他们的判断以改进搜索质量。当然,相比人工判断,Google主要还是依靠系统进行机器判断,毕竟人力资源的花费很大。最后,Google有时候也会邀请用户到Google实验室里或直接到用户家里监视他们的搜索过程,这样Google就可以清楚用户在搜索时所遇上的困难。
当然,上述这些手段并不令人惊讶,因为你大概早就已经作过类似的猜测。除了这些手段外,Google还会根据用户的Google帐户历史记录来判断用户的行为习惯,以个性化搜索结果的形式向用户提供不同的搜索体验。
(Thanks Philipp!)
Til next time,
Jason at 00:00