• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            牽著老婆滿街逛

            嚴(yán)以律己,寬以待人. 三思而后行.
            GMail/GTalk: yanglinbo#google.com;
            MSN/Email: tx7do#yahoo.com.cn;
            QQ: 3 0 3 3 9 6 9 2 0 .

            HillTop (LocalScore) 算法

            HillTop (LocalScore) 算法
            作者:Atul Gupta
            Google新算法的廬山真面目到底是什么?這仍然是個(gè)迷。而在Google網(wǎng)站上,從其"對(duì)高質(zhì)量?jī)?nèi)容網(wǎng)站進(jìn)行獎(jiǎng)勵(lì)及對(duì)采用惡意技術(shù)的網(wǎng)站進(jìn)行懲戒"內(nèi)容中,亦無(wú)什么新內(nèi)容可尋端倪。自然,作為搜索引擎,這種做法是完全可以理解的。搜索引擎的算法應(yīng)該是保密的,因?yàn)樗鼈儗?duì)新算法的任何評(píng)論,同意或否定的言行都會(huì)泄露其新算法,而任何對(duì)排名系統(tǒng)的一丁點(diǎn)泄漏都有可能被一些人鉆了空子,并用來(lái)惡意操縱搜索結(jié)果,從而破壞搜索結(jié)果的客觀公正性。
            我們根據(jù)一些比較具有可行性的推測(cè),并結(jié)合實(shí)際研究、試驗(yàn),以及對(duì)搜索引擎行為的發(fā)展趨勢(shì)和歷史的知識(shí)基礎(chǔ),得出了一些發(fā)現(xiàn)。首先,我們來(lái)看看對(duì)于Google新算法的一些比較值得注目的發(fā)現(xiàn):

            1.Google新算法種種之種種傳言 & 猜測(cè)

            對(duì)于Google新算法主要有下面這樣一些傳言和猜測(cè):

            開(kāi)始使用詞典對(duì)號(hào)入座;

            意圖施壓使商業(yè)站點(diǎn)使用Adwords廣告服務(wù);

            開(kāi)始使用"基于貝葉斯定理的SPAM過(guò)濾系統(tǒng)" ;

            開(kāi)始處罰互惠鏈接,"優(yōu)化"網(wǎng)頁(yè),或"鏈接文本" ;

            眾多猜測(cè)中,"Google意圖施壓使商業(yè)站點(diǎn)使用Adwords廣告服務(wù)"顯然占了上風(fēng)。許多
            搜索引擎優(yōu)化 分析家都認(rèn)為:Google通過(guò)一個(gè)保密的過(guò)濾系統(tǒng)"黑名單"來(lái)對(duì)商業(yè)網(wǎng)站進(jìn)行篩選,從而達(dá)到上述目的。對(duì)此觀點(diǎn)我實(shí)在不敢茍同。解釋如下…

            1.1 是否若查詢(xún)條件中包含"商業(yè)性關(guān)鍵詞"時(shí),Google會(huì)對(duì)搜索結(jié)果進(jìn)行篩選?

            因?yàn)檫@次更新中損失最慘重的是一些商業(yè)網(wǎng)站,所以有很多
            搜索引擎優(yōu)化 專(zhuān)家都認(rèn)為Google開(kāi)始對(duì)那些含有所謂"商業(yè)性關(guān)鍵詞"的查詢(xún)條件所產(chǎn)生的查詢(xún)結(jié)果進(jìn)行篩選。而從優(yōu)化專(zhuān)家針對(duì)此所做的一些最初的測(cè)試結(jié)果來(lái)看,確實(shí)也表明了一些看起來(lái)似乎能夠證實(shí)這種推測(cè)的征兆。

            1.2 Google此舉動(dòng)機(jī)何在?

            如果這是真的,那么Google為什么要這樣做?這種推測(cè)的后盾在于Google算法更新的時(shí)間正好在圣誕購(gòu)物季節(jié)之前,并適逢其IPO上市之際。分析家認(rèn)為:Google這樣做是為了向商業(yè)性站點(diǎn)施加壓力,如果這些商業(yè)網(wǎng)站期盼在一年一度的美國(guó)傳統(tǒng)的圣誕購(gòu)物季節(jié)得到豐厚贏利的話,就得花錢(qián)做AdWords自助廣告。免費(fèi)午餐看來(lái)是沒(méi)有了。還有一些人則認(rèn)為Google此舉旨在為其最終業(yè)績(jī)(即基線)涂抹上一點(diǎn)光明的色彩來(lái)打動(dòng)其未來(lái)投資者。

            1.3 那么又是誰(shuí)取代了商業(yè)站點(diǎn)原來(lái)的交椅?

            從結(jié)果頁(yè)上看,前20個(gè)結(jié)果好象都是一些官方站點(diǎn)(.gov),教育類(lèi)站點(diǎn)(.edu),公益組織性站點(diǎn)(.org),目錄及非美國(guó)本土的站點(diǎn)。由于這些站點(diǎn)一般并不太需要做廣告,所以分析家們據(jù)此相信:提升這些類(lèi)型的網(wǎng)站不會(huì)影響到Google的廣告收入,同時(shí)還可以對(duì)商業(yè)性站點(diǎn)施壓并迫使其加入Google的AdWords自助廣告陣營(yíng)中來(lái)。

            1.4 Google從何獲得"商業(yè)性關(guān)鍵詞"名單?

            從Google的AdWords廣告系統(tǒng),Google已然擁有一個(gè)大型的"商業(yè)性關(guān)鍵詞"的數(shù)據(jù)庫(kù)。有趣的是,等于是那些廣告客戶(hù)和商業(yè)性站點(diǎn)的所有者自己把哪些是"好的商業(yè)詞語(yǔ)"告訴給Google了-Google通過(guò)廣告者對(duì)關(guān)鍵詞語(yǔ)的競(jìng)標(biāo)價(jià)格的變化完全可以看出每個(gè)關(guān)鍵詞語(yǔ)的"價(jià)值"來(lái)。

            1.5 事實(shí)究竟如何?Google是否確是在用"商業(yè)關(guān)鍵詞"名單來(lái)過(guò)濾掉商業(yè)站點(diǎn)?

            我個(gè)人認(rèn)為:這種想法實(shí)在與事實(shí)太過(guò)相悖,而且我堅(jiān)信:Google并不象分析家們所認(rèn)為的在"過(guò)濾"站點(diǎn)。而且我相信,Google壓根就沒(méi)有什么"商業(yè)關(guān)鍵詞"名單。一度流行的這種"過(guò)濾名單"理論是分析家們從自己所看到的跡象上得出的,而事實(shí)上這些所謂的跡象是由于其它原因所引發(fā)的,而并不是什么"過(guò)濾"所導(dǎo)致的。后面我會(huì)就此問(wèn)題向大家詳細(xì)解釋和闡述。

            不可否認(rèn),從實(shí)踐中我們確實(shí)可以看到一些象"過(guò)濾"的結(jié)果,但我們有理由相信這樣的結(jié)果實(shí)際上是Google新算法的一種"副產(chǎn)品",而非Google本意。新算法意圖對(duì)商業(yè)性網(wǎng)站而不是公益性網(wǎng)站施加影響。稍后我會(huì)向大家詳細(xì)解釋…

            Scroogle.org,這個(gè)由不喜歡Google的群體所建立的網(wǎng)站,原來(lái)可以通過(guò)一種巧妙的方式從Google上提取數(shù)據(jù),并向用戶(hù)提供一種可檢查網(wǎng)站在Google上的"未過(guò)濾"的往日排名結(jié)果的工具。不過(guò)由于Google現(xiàn)已更新了算法以禁止此類(lèi)查詢(xún),故Scroogle.org現(xiàn)已無(wú)法提供這樣的工具。不過(guò),該網(wǎng)站仍顯示有一個(gè)從其網(wǎng)站上多方搜索而收集到的所謂"Filter Hit"名單。我研究過(guò)這個(gè)名單。 我覺(jué)得,它充其量也只能證明了Google并未使用任何如上所說(shuō)之名單。不然的確話,如何解釋"California Divorce Attorney"位于名單之首而"Books"或"Adult"卻屈居最下席?難道在Google眼里,"California Divorce Attorney"比"Books"或"Adult"更有商業(yè)價(jià)值?

            Google任何從正常的排名機(jī)制中過(guò)濾掉把商業(yè)性站點(diǎn)的企圖都是對(duì)Google品牌,乃至對(duì)其公正的搜索結(jié)果信譽(yù)的嚴(yán)重?fù)p害。若真有這樣的企圖,那Google真是太短視了,根本配不上它的品牌和它的服務(wù)。Google的股票上市(IPO)和最終業(yè)績(jī)都將因此而毀于一旦。此外,Google也說(shuō)過(guò),其"搜索服務(wù)"和"AdWords自助廣告"服務(wù)分屬兩個(gè)不同的工作部門(mén),且互不搭界、互不影響。對(duì)此我還是相信的。


            2.Google搜索技術(shù)的幾個(gè)明顯變化

            2.1 Google開(kāi)始采用詞干技術(shù)(stemming)

            Google確已在搜索結(jié)果中采用了詞干技術(shù)。在早先,如果搜索一個(gè)單數(shù)查詢(xún)條件如"home garden",則搜索結(jié)果中不會(huì)出現(xiàn)如"home gardens","home gardening"這樣的關(guān)鍵詞變化形式,反之亦然。對(duì)于Google的用戶(hù)來(lái)說(shuō),這種特性可能是一件好事情,因?yàn)樗阉魈峁┑慕Y(jié)果更多了,但站在
            搜索引擎優(yōu)化 的立場(chǎng)來(lái)看,由于搜索結(jié)果的驟然增加,對(duì)關(guān)鍵詞的競(jìng)爭(zhēng)亦驟然加劇。

            2.2 Google于搜索結(jié)果中使用了拼寫(xiě)糾錯(cuò)工具

            Google開(kāi)始將其拼寫(xiě)檢查工具用于搜索結(jié)果中。例如,當(dāng)輸入查詢(xún)條件為"Search Engine Optimisation"后,以往Google只會(huì)提示你是否是要找"Search Engine Optimization",但顯示的還是符合"Optimisation"的搜索結(jié)果。不過(guò)現(xiàn)在則能看到"Optimization"的搜索結(jié)果。再如:"e-mail solution"和"email solution"的搜索結(jié)果一致,而"e-commerce"則與"ecommerce"的搜索結(jié)果是一致的,這樣就增加了數(shù)據(jù)的競(jìng)爭(zhēng)性。

            3.對(duì)Hilltop算法的分析和推測(cè)

            3.1 為什么采用新算法

            大多數(shù)網(wǎng)迷們都知道,頁(yè)面等級(jí)算法是由Google的創(chuàng)始人Sergey Brin和Larry Page所倡起的,用以精良網(wǎng)站在搜索結(jié)果中的排名。這也是自1998年Google發(fā)布以來(lái)的取得種種驕人成績(jī)的重要因素之一。

            但頁(yè)面等級(jí)系統(tǒng)亦存在著一個(gè)基本的缺陷,Google也深知這一點(diǎn)。它根據(jù)一個(gè)網(wǎng)頁(yè)上被鏈接的站點(diǎn)數(shù)量和質(zhì)量來(lái)給該網(wǎng)頁(yè)分配一個(gè)絕對(duì)的"重要性值"。同時(shí)亦將鏈接頁(yè)面的頁(yè)面等級(jí)考慮在內(nèi)。指向一個(gè)網(wǎng)頁(yè)的外部鏈接頁(yè)的頁(yè)面等級(jí)越高,則該鏈接頁(yè)面?zhèn)鬟f給該網(wǎng)頁(yè)的頁(yè)面等級(jí)值也就越高。但是,"頁(yè)面等級(jí)值"并非針對(duì)查詢(xún)?cè)~語(yǔ),因而一個(gè)網(wǎng)頁(yè)即使只是在內(nèi)容中偶然提到了一個(gè)和查詢(xún)主題偏離的關(guān)鍵詞語(yǔ),也會(huì)因其居高的頁(yè)面等級(jí)值而獲得一個(gè)比較高的排名。

            美國(guó)加州的克利須那。伯哈拉特(Krishna Bharat) 意識(shí)到基于頁(yè)面等級(jí)的排名系統(tǒng)中所存在的這種瑕玼,并于2000年提出了一種新算法,他稱(chēng)其為"Hilltop"算法,并于2001年的一月份申請(qǐng)了Hilltop專(zhuān)利權(quán),Google成為受讓方。不言而喻,Google已然意識(shí)到這種新算法與其頁(yè)面等級(jí)系統(tǒng)的整合將為Google的排名系統(tǒng)帶來(lái)良好的效果。

            我深信,在Google最近的更新中,不但運(yùn)用了Google自身的頁(yè)面等級(jí)和相關(guān)性算法,而且還結(jié)合使用了Hilltop算法用于精工調(diào)整頁(yè)面等級(jí)的效果,只不過(guò)Hilltop算法可能已迥異于它最初的模樣了。

            3.2 什么是Hilltop算法?

            對(duì)此算法有興趣了解并想挖根究底的人可以看看克利須那。伯哈拉特當(dāng)年所寫(xiě)的Hilltop論文及詳細(xì)的Hilltop專(zhuān)利信息。但對(duì)我們大多數(shù)人來(lái)說(shuō),只要知道Hilltop算法到底是個(gè)什么東東就可以了。簡(jiǎn)單地說(shuō),頁(yè)面等級(jí)決定一個(gè)網(wǎng)頁(yè)的"權(quán)威性",而Hilltop(LocalScore)則決定匹配一查詢(xún)條件的一個(gè)網(wǎng)頁(yè)的"權(quán)威性"。

            Bharat提出:在利用"頁(yè)面等級(jí)"來(lái)尋找"權(quán)威"網(wǎng)頁(yè)時(shí),不應(yīng)單純依賴(lài)于值的大小來(lái)定奪,而應(yīng)將重點(diǎn)放在它與查詢(xún)主題的相關(guān)性上; 即不但需要考慮網(wǎng)頁(yè)的頁(yè)面等級(jí),還要考慮該網(wǎng)頁(yè)的頁(yè)面等級(jí)與查詢(xún)主題的相關(guān)性是否相稱(chēng)。若一個(gè)網(wǎng)頁(yè)只與查詢(xún)主題只沾點(diǎn)邊,那么即使其頁(yè)面等級(jí)非常之高,對(duì)用戶(hù)來(lái)說(shuō)也是沒(méi)有意義的。如此一來(lái),于網(wǎng)頁(yè)而言,那些來(lái)自于"相關(guān)主題"的文檔的鏈接就更有意義了 (Bharat稱(chēng)這種"相關(guān)主題"文檔為"專(zhuān)家文檔"),一個(gè)網(wǎng)頁(yè)的所有外部"專(zhuān)家文檔"鏈接構(gòu)成了該網(wǎng)頁(yè)的"權(quán)威性值"。Hilltop算法的意義在于:相同主題網(wǎng)站之間的鏈接應(yīng)比非相關(guān)網(wǎng)站的鏈接具有更高的價(jià)值。

            Hilltop算法以如下方式計(jì)算一個(gè)網(wǎng)頁(yè)的"權(quán)威值"(這只是極為簡(jiǎn)單的一個(gè)例子):

            以該關(guān)鍵詞進(jìn)行一次普通查詢(xún)找專(zhuān)家文檔"文集"。"專(zhuān)家文檔"的定義有嚴(yán)格標(biāo)準(zhǔn),因該"文集"應(yīng)是數(shù)量上易于管理的一組網(wǎng)頁(yè)。

            從返回的專(zhuān)家列表中把成員站點(diǎn)(見(jiàn)下注解*)和鏡象站點(diǎn)去掉。

            根據(jù)所獲得的上述專(zhuān)家文檔對(duì)其投票的數(shù)量和質(zhì)量,網(wǎng)頁(yè)被分配以一個(gè)“局部分?jǐn)?shù)”(LocalScore)。然后按網(wǎng)頁(yè)的“局部分?jǐn)?shù)”進(jìn)行排名。
            *注解:成員站點(diǎn)指來(lái)自同一個(gè)域,或域相同而后綴不同的站點(diǎn),如ibm.com,ibm.co.uk,ibm.co.jp等等,或指來(lái)自相鄰的IP地址的站點(diǎn) (前三位IP地址相同,形如64.129.220.xxx)
            此外,若兩個(gè)站點(diǎn)均為相同IP地址下的宿主,則認(rèn)為其中一個(gè)是另外一個(gè)站點(diǎn)的成員站點(diǎn)。(即:若ww.abc.com和
            www.ibm.com 均為相同IP地址下的宿主,則認(rèn)為 www.abc.com www.ibm.co.uk 的成員站點(diǎn))
            Hilltop算法的一個(gè)極其重要的特征在于:若沒(méi)有找到搜索引擎認(rèn)為數(shù)量足夠的“專(zhuān)家文件”(要求至少需有兩票),則該算法失效,即返回結(jié)果為零。換言之,對(duì)于高度明確化的查詢(xún)條件(查詢(xún)?cè)~語(yǔ)),Hilltop算法的結(jié)果很可能為“0”。這是該算法的一個(gè)獨(dú)特特性。如此一來(lái),造成了
            SEO 一族中的大部分人都深信Google的確在用“商業(yè)詞”過(guò)濾名單來(lái)過(guò)濾掉商業(yè)網(wǎng)站。

            事實(shí)上,在Hilltop算法無(wú)法奏效時(shí),將顯示“舊”Google的搜索結(jié)果。這些查詢(xún)條件的集合就是
            SEO 一族所收集并稱(chēng)之為的“商業(yè)詞名單”。這一效果無(wú)意中卻提供了一個(gè)強(qiáng)有力的證據(jù),表明Google確是采用了Hilltop算法。2003年11月15號(hào),Google基于新算法的更新之后, 某分析家就指出:在進(jìn)行查詢(xún)時(shí),若對(duì)某一查詢(xún)條件加上一些“不包含”的無(wú)意義字符,如“car rental – ghjkl”,則Google將會(huì)顯示以往(算法變化前)的搜索結(jié)果,而繞過(guò)所謂的“商業(yè)詞”過(guò)濾名單。

            例如,若查找“real estate –hdfkdhgk”,則Google將試圖返回所有關(guān)于“real estate”,同時(shí)內(nèi)容中又不包含“hdfkdhgk”的頁(yè)面。又由于包含“hdfkdhgk” 這種字眼的網(wǎng)頁(yè)幾乎沒(méi)有,所以按道理來(lái)講,Google返回的查詢(xún)結(jié)果應(yīng)該和“real estate”的查詢(xún)結(jié)果是相同的。然而結(jié)果卻出人意料:Google所顯示的查詢(xún)結(jié)果和采用新算法之前的搜索結(jié)果的排名是相同的。事實(shí)上,Scroogle.org這個(gè)網(wǎng)站就是捕捉Google的搜索結(jié)果在排名上的不同,并以此得出一個(gè)所謂的“商業(yè)詞”過(guò)濾名單。

            在所謂的“商業(yè)詞”背后到底是什么?

            我們相信,“商業(yè)詞”過(guò)濾式效果只是Hilltop算法的一個(gè)衍生癥狀。每當(dāng)用戶(hù)進(jìn)行類(lèi)似“real estate –hdfkdhgk”的查詢(xún)時(shí),Google都會(huì)對(duì)整個(gè)查詢(xún)?cè)~語(yǔ)進(jìn)行Hilltop運(yùn)算,當(dāng)無(wú)法找到足夠的包含這種查詢(xún)?cè)~語(yǔ)的“專(zhuān)家文件”時(shí),該算法將返回一個(gè)零值(即零效果)。 這就意味著我們通過(guò)這種多少有些滑稽的特殊排除詞語(yǔ)繞過(guò)了Hilltop算法, 這時(shí)候Google的其它算法就該出頭發(fā)揮作用了,而它們所提供的查詢(xún)結(jié)果明顯地和算法更新前的查詢(xún)結(jié)果是一樣的! 后來(lái)Scroogle.org的聲名鵲起讓Goolge發(fā)現(xiàn)了這個(gè)bug。后來(lái)Google為了防止此類(lèi)漏洞,索性把查詢(xún)分成兩步走,先把排除條件詞語(yǔ)放一邊,將查詢(xún)條件送至Hilltop進(jìn)行運(yùn)算,如此一來(lái),由于Hilltop不再同時(shí)對(duì)排除條件進(jìn)行解析,所以可保證其正常發(fā)揮效用,并提供相應(yīng)的搜索結(jié)果,然后再將此結(jié)果傳遞給Google算法,Google根據(jù)最初查詢(xún)中的排除條件從Hilltop提供的結(jié)果中將符合排除條件的網(wǎng)頁(yè)剔除,然后再將結(jié)果顯示給用戶(hù)。這也就是為什么我們現(xiàn)在用上面的法子再也無(wú)法看到“舊Google”的搜索結(jié)果的原因了。

            Google新算法意義何在

            Hilltop算法與Google的頁(yè)面等級(jí)算法及頁(yè)面相關(guān)性算法的結(jié)合看起來(lái)是超佳組合,幾乎無(wú)懈可擊。其聯(lián)姻對(duì)于鏈接流行度/頁(yè)面等級(jí)和來(lái)自專(zhuān)家文件(LocalScore)的鏈接對(duì)你網(wǎng)站的排名的影響程度有著深遠(yuǎn)的意義。
            我列了一個(gè)簡(jiǎn)單的公式來(lái)說(shuō)明新算法的效果和影響 (謹(jǐn)供參考):

            “舊”Google排名公式 = {(1-d)+a (RS)} * {(1-e)+b (PR * fb)}

            “新”Google排名公式 = {(1-d)+a (RS)} * {(1-e)+b (PR * fb)} *{(1-f)+c (LS)}
            其中:

            RS = 相關(guān)性得分:基于網(wǎng)頁(yè)標(biāo)題(Title)。元標(biāo)識(shí)(Meta tags), 正文標(biāo)題(Headlines),正文(Body text)。URL,圖片Alt文字,錨文字(Anchor Text)等元素中出現(xiàn)的關(guān)鍵詞得出的分?jǐn)?shù)。
            PR = 頁(yè)面等級(jí):(基于鏈接至你網(wǎng)站的網(wǎng)頁(yè)數(shù)量及其PR值得出的分?jǐn)?shù)。原始公式為PR (A) = (1-d) + d (PR (t1)/C (t1) + …+ PR (tn)/C (tn)),其中D為阻尼因子,一般設(shè)為0.85; 公式可描述為:A網(wǎng)頁(yè)的其PR值等于鏈向該頁(yè)面的所有鏈接頁(yè)面的PR值分別除以各自的外部鏈接數(shù)量的總和。
            LS = 行業(yè)得分(LocalScore):根據(jù)專(zhuān)家文件計(jì)算得出的分?jǐn)?shù)。

            a,b,c = 調(diào)節(jié)控制比重:Google用于精工調(diào)整查詢(xún)結(jié)果

            d,e,f = 阻尼控制:Google用于精工調(diào)整查詢(xún)結(jié)果。目前“f”值可能為“0”。

            fb = 因子基數(shù):Google工具欄山所顯示的頁(yè)面等級(jí)得分范圍從1到10,但它實(shí)質(zhì)上并不是一個(gè)線性函數(shù),而是一個(gè)指數(shù)/對(duì)數(shù)函數(shù)。經(jīng)過(guò)分析,我們認(rèn)為它有一個(gè)趨近于8的基數(shù)。即PR為5的網(wǎng)頁(yè)的值比PR為4要多8倍之多(PR5=PR4X8),同樣,一個(gè)PR值為8的網(wǎng)站比一個(gè)PR值為4的網(wǎng)站的值要高出4000多倍(PR8=PR4X8X8X8X8)。

            Google新算法的優(yōu)勢(shì)/優(yōu)點(diǎn)

            頁(yè)面因子極易被人利用和控制,例如最早被用作排名因子的META TAGS,就由于很多網(wǎng)站無(wú)度的關(guān)鍵詞充斥泛濫而不得不被搜索引擎喊停。此外,在開(kāi)始的時(shí)候,由于顧忌到真實(shí)來(lái)訪者的感受,對(duì)網(wǎng)站內(nèi)容一般作手腳的并不多,但后來(lái)亦難免誘惑,過(guò)度優(yōu)化,甚至頁(yè)面上放上許多“隱形”的內(nèi)容已是屢見(jiàn)不鮮的伎倆。頁(yè)面因子確實(shí)無(wú)形中賦予網(wǎng)站管理員太多“惡意”控制權(quán)。而在Google的新算法中,各排名因素所占比重分別如下:

            總“排名”得分由三部分組成:相關(guān)性得分(頁(yè)面因素),頁(yè)面等級(jí)得分(非頁(yè)面因素)和行業(yè)得分(非頁(yè)面因素):
            相關(guān)性得分(RS)= 20%,頁(yè)面等級(jí)值(PR) = 40%,行業(yè)得分(LS) = 40%
            其中:

            RS (相關(guān)性得分:頁(yè)面相關(guān)度) --是所有
            SEO 努力的轉(zhuǎn)換結(jié)果;

            PR (頁(yè)面等級(jí)得分:外部鏈接度) --是所有建立鏈接的努力的轉(zhuǎn)換結(jié)果;

            LS (行業(yè)得分:專(zhuān)家文件鏈接度) --是得自專(zhuān)家文件的鏈接的轉(zhuǎn)換結(jié)果;

            從上述結(jié)果不難看出,頁(yè)面優(yōu)化的得分只占到20%,Google顯然已將重心轉(zhuǎn)至非頁(yè)面因子上,而把排名控制權(quán)越來(lái)越多地從網(wǎng)站管理員手中奪回來(lái)。假若一個(gè)水平一般般的優(yōu)化專(zhuān)家可以拿到RS中的10分,而一個(gè)水平很高的優(yōu)化專(zhuān)家最高也不過(guò)能拿到18,19分,大家可以看到:這兩個(gè)水平懸殊的優(yōu)化專(zhuān)家之間的差別僅僅只有8分而已!

            Hilltop算法是否以實(shí)時(shí)方式運(yùn)行

            Google所擁有的服務(wù)器體系架構(gòu)就是網(wǎng)絡(luò)上分布的一萬(wàn)臺(tái)奔騰級(jí)服務(wù)器。而一旦了解了Hilltop算法后,我們很難相信這樣的奔騰服務(wù)器能夠具備如此的處理能力:試想一下,首先要從成千上萬(wàn)的主題性文件中找到“專(zhuān)家文件”,然后計(jì)算目標(biāo)網(wǎng)頁(yè)自這些專(zhuān)家文件的鏈接的得分,然后再將數(shù)值返回Google算法的其它排名系統(tǒng),并做進(jìn)一步處理—而所有這些要在大約0.07秒內(nèi)--這個(gè)讓Google舉世聞名的搜索速度內(nèi)完成。確實(shí)使人難以置信。

            Hilltop算法的運(yùn)行頻率及涵蓋范圍

            我們認(rèn)為,要保證Google一貫的“閃電般”搜索速度,Google會(huì)對(duì)搜索頻率較高(熱門(mén))的查詢(xún)?cè)~(即所謂的“商業(yè)詞”黑名單)定期運(yùn)行批處理,并將結(jié)果存儲(chǔ)起來(lái)供日后使用。Google的數(shù)據(jù)庫(kù)擁有數(shù)目龐大的高查詢(xún)頻率的查詢(xún)?cè)~,收集自實(shí)地搜索和其AdWords自助廣告系統(tǒng)中所使用的關(guān)鍵詞。Google很可能對(duì)關(guān)鍵詞搜索次數(shù)設(shè)置了上限值,凡搜索頻率高于此閾值的查詢(xún)?cè)~都將被納入Hilltop系統(tǒng),然后Hilltop系統(tǒng)再對(duì)收集的所有高查詢(xún)頻率關(guān)鍵詞定期運(yùn)行批處理,可能一個(gè)月一次。增量級(jí)的稍小規(guī)模的批處理可能會(huì)頻繁一些。 同時(shí),每個(gè)月將對(duì)Hilltop系統(tǒng)運(yùn)行批處理后的結(jié)果對(duì)Google的萬(wàn)臺(tái)服務(wù)器的數(shù)據(jù)庫(kù)進(jìn)行同步更新,但稍小規(guī)模的批處理的數(shù)據(jù)庫(kù)更新會(huì)更加頻繁一些。

            對(duì)于那些用戶(hù)查詢(xún)頻率不算高,因而無(wú)此“榮幸”被納入Hilltop算法的查詢(xún)?cè)~語(yǔ),Google仍將使用原來(lái)的算法并顯示原來(lái)的排名結(jié)果。因而對(duì)于那些高度明確或?qū)I(yè)化的關(guān)鍵詞,由于它們被排除在新算法的范圍之內(nèi),因而有望保持原來(lái)的排名。

            Hilltop算法為何經(jīng)過(guò)如此長(zhǎng)時(shí)間才投入使用

            Google早在2003年2月就獲得了該專(zhuān)利,但在實(shí)際投入使用前,需要首先保證新算法和Google當(dāng)時(shí)所使用的頁(yè)面等級(jí)和頁(yè)面相關(guān)性系統(tǒng)的完全兼容性,所以需要對(duì)其兼容性做大量測(cè)試,然后再評(píng)估算法整合后所提供的結(jié)果,再做精工調(diào)整,然后是進(jìn)一步的繁復(fù)測(cè)試…我想所有這些都需要大量時(shí)間。

            Google新算法的不利方面/瑕疵

            經(jīng)過(guò)進(jìn)一步分析,我們發(fā)現(xiàn)了該算法存在著的若干缺陷和不足:

            Hilltop的前提是每個(gè)專(zhuān)家文件都是完全公正的,且無(wú)欺騙和人工操縱成分。然而情況可能并非如此理想。專(zhuān)家文件的一個(gè)小小污點(diǎn)就可以對(duì)排名產(chǎn)生極大的負(fù)面影響。

            Hilltop意圖通過(guò)“權(quán)威性”專(zhuān)家文件的鏈接來(lái)確定一個(gè)網(wǎng)頁(yè)的行業(yè)可信度,但又不能夠明確保證這些所謂的“專(zhuān)家文件”的”“量”確是名副其實(shí)。

            運(yùn)行Hilltop算法需要大量的計(jì)算機(jī)處理能力,因而我們猜測(cè)Hilltop算法(可能)是每個(gè)月對(duì)收集到的全部高頻率(熱門(mén))查詢(xún)?cè)~運(yùn)行一次批處理。由于Google算法將40%重心轉(zhuǎn)移至Hilltop,且Hilltop算法運(yùn)行后的得分會(huì)保持至下一次批處理,因而在此期間搜索結(jié)果很可能不會(huì)有太大變動(dòng)。此外,由于“專(zhuān)家”網(wǎng)頁(yè)的投票方式往往不會(huì)有太大變動(dòng),因而在某段時(shí)期內(nèi)我們可能只會(huì)看到一些“陳舊”的搜索結(jié)果。這一點(diǎn)悖離了搜索引擎的“提供最新、最好”的查詢(xún)結(jié)果的宗旨。除了“權(quán)威網(wǎng)頁(yè)”,用戶(hù)同樣希望看到一些新鮮的內(nèi)容,然而對(duì)“新”Google而言,用戶(hù)只有寄望于那些查詢(xún)頻率不太高,從而未被納入Hilltop系統(tǒng)的查詢(xún)?cè)~語(yǔ)上看到“新鮮”的查詢(xún)結(jié)果了。

            新站點(diǎn)對(duì)熱門(mén)查詢(xún)?cè)~的排名的難度將越發(fā)加大??磥?lái)對(duì)于那些特別熱門(mén)的查詢(xún)?cè)~,Google對(duì)新網(wǎng)站或新內(nèi)容的排名的門(mén)檻是越來(lái)越高了。

            商業(yè)性站點(diǎn)要鏈向網(wǎng)絡(luò)分類(lèi)目錄,貿(mào)易協(xié)會(huì),政府貿(mào)易機(jī)構(gòu),教育機(jī)構(gòu),公益性組織的站點(diǎn)并非難事,故而這樣的站點(diǎn)會(huì)占據(jù)搜索結(jié)果的前十名位置。


            哪些站點(diǎn)是Google新算法最可能的殃及者?

            成員站點(diǎn)/域群集/運(yùn)行于相同服務(wù)器下的MLM(多層營(yíng)銷(xiāo)系統(tǒng)程序)程序。

            過(guò)度依賴(lài)“頁(yè)面”優(yōu)化因子的網(wǎng)站。

            依賴(lài)高度競(jìng)爭(zhēng)性的查詢(xún)?cè)~語(yǔ)來(lái)獲得訪問(wèn)量的網(wǎng)站。

            對(duì)網(wǎng)站擁有者的若干建議:

            排名規(guī)則已發(fā)生重大改變,網(wǎng)站的成功推廣需從提高PR值及獲得更多來(lái)自“專(zhuān)家文件”的鏈接著手;

            盡可能為更多主流網(wǎng)上分類(lèi)目錄(DMOZ,Yahoo,About,LookSmart等),貿(mào)易目錄,黃頁(yè),貿(mào)易協(xié)會(huì)和資源頁(yè)等所收錄;

            避免使用域群集/成員程序或帶有成員性質(zhì)的系統(tǒng);

            避免來(lái)自可疑的FFA站點(diǎn)及鏈接工廠的互惠鏈接。

            若干需要澄清的傳言:

            關(guān)于“過(guò)度優(yōu)化會(huì)受到懲罰”之說(shuō)--過(guò)濾優(yōu)化本身就是一種SPAM,因而受到懲罰也是理所當(dāng)然的事情。然而當(dāng)前大多數(shù)商業(yè)網(wǎng)站所受到的排名沖擊并非由于受到懲罰,而是由Google將重心從頁(yè)面因子轉(zhuǎn)至非頁(yè)面因子而造成的。網(wǎng)站的良好優(yōu)化仍必不可少。

            關(guān)于“建立外部鏈接不再重要”之說(shuō)--建立鏈接流行度還是和從前一樣舉足輕重,甚至還有可能會(huì)更加重要。Google專(zhuān)利的頁(yè)面等級(jí)算法仍舊占據(jù)舉足輕重的地位。

            關(guān)于“Google開(kāi)始使用‘商業(yè)詞’過(guò)濾名單”之說(shuō)--Google并沒(méi)有使用任何“過(guò)濾名單”來(lái)懲罰商業(yè)站點(diǎn)。Google也無(wú)意去“懲罰”或“篩掉”任何東西,它所力求的只是建立一個(gè)能夠識(shí)別最具備相關(guān)性網(wǎng)頁(yè)的系統(tǒng)。

            站點(diǎn)收錄進(jìn)DMOZ,Google目錄和商業(yè)目錄收錄會(huì)讓Google認(rèn)為該站點(diǎn)屬商業(yè)性網(wǎng)站,從而對(duì)其進(jìn)行懲罰--正相反,由于這些目錄都是質(zhì)量非常之高的“專(zhuān)家文件”,因而得到這些目錄的鏈接不但不會(huì)受到懲罰,反而會(huì)帶給你較高的收益。

            隨著Google對(duì)其算法的大更新,我們不得不承認(rèn),要想讓網(wǎng)站得到好的排名真是越來(lái)越不容易了。若只采用簡(jiǎn)單的優(yōu)化技術(shù),如元標(biāo)識(shí)(Meta)或頁(yè)面優(yōu)化,幾乎沒(méi)辦法得到理想排名。我們需要顧及很多的算法變量,而不僅僅是一個(gè)Meta Tags。
            搜索引擎優(yōu)化 會(huì)更為專(zhuān)業(yè)化。老式的優(yōu)化伎倆已經(jīng)不管用或收效甚微了?,F(xiàn)在需要計(jì)劃和實(shí)施的是全方位的 SEO 策略。為保證成效, SEO 專(zhuān)家現(xiàn)在需要做的是投入更多的智慧、研究、分析、計(jì)劃和時(shí)間。這樣的話, SEO 的優(yōu)化“成本”亦將逐漸增高。

            PPC(付費(fèi)點(diǎn)擊)的價(jià)格會(huì)繼續(xù)攀升。PPC廣告方式不但會(huì)成為網(wǎng)上營(yíng)銷(xiāo)策略的一個(gè)主要組成部分,而且需要保證相應(yīng)的搜索引擎訪問(wèn)量?,F(xiàn)在,網(wǎng)站的外部鏈接和頁(yè)面等級(jí)愈加重要。它對(duì)排名的影響更加重要。
            搜索引擎優(yōu)化 和建立鏈接的結(jié)合已勢(shì)在必行。此外,搜索引擎排名算法的更新不僅會(huì)越加頻繁,而且幅度會(huì)越來(lái)越大?,F(xiàn)在,定期的 搜索引擎優(yōu)化 維護(hù)變得尤為重要。對(duì)網(wǎng)站的 搜索引擎優(yōu)化 不僅是必須的,而且大有裨益。

            很多網(wǎng)站都丟掉了它們?cè)瓉?lái)的好排名,因而尤其需要搜索優(yōu)化專(zhuān)家。每一次更新算法都是對(duì)
            搜索引擎優(yōu)化 人員名單的一次縮水。搜索引擎的優(yōu)化和排名生意變得愈加困難,然而也愈加重要了。

            posted on 2006-04-17 18:45 楊粼波 閱讀(462) 評(píng)論(1)  編輯 收藏 引用

            評(píng)論

            # re: HillTop (LocalScore) 算法 2006-05-07 11:32 小東

            很不錯(cuò)啊,第一次了解到關(guān)于搜索引擎的這么多東西.辛苦啦!  回復(fù)  更多評(píng)論   


            只有注冊(cè)用戶(hù)登錄后才能發(fā)表評(píng)論。
            網(wǎng)站導(dǎo)航: 博客園   IT新聞   BlogJava   博問(wèn)   Chat2DB   管理


            精品久久久久久久久久久久久久久| 综合久久精品色| 精品一区二区久久| 久久亚洲高清综合| a高清免费毛片久久| 亚洲精品久久久www| 久久精品国产亚洲AV影院| 久久久精品久久久久久 | 久久se精品一区精品二区| 精品欧美一区二区三区久久久 | 中文国产成人精品久久亚洲精品AⅤ无码精品 | 久久996热精品xxxx| 亚洲人成伊人成综合网久久久| 99久久精品免费看国产| 精品久久8x国产免费观看| 亚洲AV无码久久精品色欲| 久久精品国产2020| 99久久伊人精品综合观看| 国产午夜精品理论片久久影视| 亚洲午夜无码AV毛片久久| 久久夜色精品国产亚洲| 国产精品九九久久免费视频 | 久久精品国产久精国产| 狠狠色丁香婷婷久久综合五月| 一级女性全黄久久生活片免费| 久久91精品国产91久久麻豆| 亚洲伊人久久综合中文成人网| 国产午夜福利精品久久| .精品久久久麻豆国产精品| 亚洲AV无码久久精品狠狠爱浪潮| 亚洲国产成人精品久久久国产成人一区二区三区综 | 日产精品99久久久久久| 99久久精品费精品国产一区二区| 久久综合亚洲色一区二区三区| 久久高清一级毛片| 久久精品18| 精品久久久久久久久久久久久久久| 伊人久久精品线影院| 99久久精品免费看国产| 久久97久久97精品免视看秋霞| 久久亚洲国产精品五月天婷|