Posted on 2005-12-07 13:20
inwind 閱讀(237)
評(píng)論(0) 編輯 收藏 引用 所屬分類:
搜索引擎
20/80法則也叫二八定律,即巴萊多定律。巴萊多定律是19世紀(jì)末20世紀(jì)初意大利經(jīng)濟(jì)學(xué)家巴萊多發(fā)明的。他認(rèn)為,在任何一組東西中,最重要的只占其中一小部分,約20%,其余80%盡管是多數(shù),卻是次要的,因此又稱二八定律。
在搜索引擎的設(shè)計(jì)上,可以說大多數(shù)的搜索引擎在搜索結(jié)果上第一頁有80%的結(jié)果是相同的,不同的只有20%??墒钦沁@20% make different.
這20%的差別也是不同搜索引擎之間的差距,能夠完善這20%將對(duì)一個(gè)搜索引擎來說是至關(guān)重要的。
在另外一方面,對(duì)于一個(gè)搜索引擎的完善,例如你可以花20%的努力做到80%的效果,而要想提高剩下的20%的效果也許要耗費(fèi)80%的精力。
一個(gè)簡(jiǎn)單的例子,一個(gè)搜索引擎現(xiàn)在還比較初級(jí),也許分詞和搜索相關(guān)的準(zhǔn)確率在80%左右,想要進(jìn)一步提高,也許要調(diào)整40,50個(gè)參數(shù),調(diào)整很多方面的因子,考慮很多的算法,花了極大的精力后發(fā)現(xiàn)只提高了一點(diǎn),再調(diào)整,如此三番,也許很久一段時(shí)間后發(fā)現(xiàn)有90%了,這個(gè)10%就是大的突破,但是要花去的努力要比從0%到80%大的多的多。
搜索引擎各項(xiàng)參數(shù)的差距也許只有幾個(gè)百分點(diǎn),可是這幾個(gè)百分點(diǎn)就是真正的差別,就真得創(chuàng)造了勝者和失敗者。
從搜索的方面看,20 80 法則有另外的意義,80%的搜索集中在20%的少量關(guān)鍵詞上,也就是說有20%的搜索詞匯占了80%的總體搜索流量。搜索的詞頻可以通過搜索引擎的每天的統(tǒng)計(jì)得到,在某一些特殊的情況,這些分布可以用來對(duì)搜索引擎進(jìn)行非常好的矯正工作。