Google--PageRank(網(wǎng)頁(yè)級(jí)別)技術(shù)解密

發(fā)布時(shí)間:2007/5/2 19:02:00

1. 什么是PageRank
2. PageRank的決定因素
3. 如何查知PageRank
4. PageRank的重要性
5. Google的前1,000項(xiàng)搜索結(jié)果
6. PageRank與其它影響網(wǎng)站排名因素間的區(qū)別

一:什么是PageRank(網(wǎng)頁(yè)級(jí)別)
        PageRank(網(wǎng)頁(yè)級(jí)別)是Google用于評(píng)測(cè)一個(gè)網(wǎng)頁(yè)“重要性”的一種方法。在揉合了諸如Title標(biāo)識(shí)和Keywords標(biāo)識(shí)等所有其它因素之后,Google通過PageRank來調(diào)整結(jié)果,使那些更具“重要性”的網(wǎng)頁(yè)在搜索結(jié)果中另網(wǎng)站排名獲得提升,從而提高搜索結(jié)果的相關(guān)性和質(zhì)量。cryokeys.com
  簡(jiǎn)單說來,Google通過下述幾個(gè)步驟來實(shí)現(xiàn)網(wǎng)頁(yè)在其搜索結(jié)果頁(yè)(SERPS)中的排名:
  1) 找到所有與搜索關(guān)鍵詞匹配的網(wǎng)頁(yè)
  2) 根據(jù)頁(yè)面因素如標(biāo)題\關(guān)鍵詞密度等排列等級(jí)
  3) 計(jì)算導(dǎo)入鏈接的錨文本中的關(guān)鍵詞
  4) 通過PageRank得分調(diào)整網(wǎng)站排名結(jié)果
  事實(shí)上,真正的網(wǎng)站排名過程并不是這么簡(jiǎn)單,我們會(huì)在后面進(jìn)行詳細(xì)深入的闡述。

二:PageRank的決定因素
Google的PageRank是基于這樣一個(gè)理論:若B網(wǎng)頁(yè)設(shè)置有連接A網(wǎng)頁(yè)的鏈接(B為A的導(dǎo)入鏈接時(shí)),說明B認(rèn)為A有鏈接價(jià)值,是一個(gè)“重要”的網(wǎng)頁(yè)。當(dāng)B網(wǎng)頁(yè)級(jí)別(重要性)比較高時(shí),則A網(wǎng)頁(yè)可從B網(wǎng)頁(yè)這個(gè)導(dǎo)入鏈接分得一定的級(jí)別(重要性),并平均分配給A網(wǎng)頁(yè)上的導(dǎo)出鏈接。

導(dǎo)入鏈接(也叫逆向鏈接)指鏈至你網(wǎng)站的站點(diǎn),也就是我們一般所說的“外部鏈接”。而當(dāng)你鏈至另外一個(gè)站點(diǎn),那么這個(gè)站點(diǎn)就是你的“導(dǎo)出鏈接”,即你向其它網(wǎng)站提供的本站鏈接。

PageRank反映了一個(gè)網(wǎng)頁(yè)的導(dǎo)入鏈接的級(jí)別(重要性)。所以一般說來,PageRank是由一個(gè)網(wǎng)站的導(dǎo)入鏈接的數(shù)量和這些鏈接的級(jí)別(重要性)所決定的。

三:如何知道一個(gè)網(wǎng)頁(yè)的PageRank得分
可從http://toolbar.google.com上下載并安裝Google的工具欄,這樣就能顯示所瀏覽網(wǎng)頁(yè)的PageRank得分了。PageRank得分從0到10,若不能顯示PageRank得分,可檢查所安裝版本號(hào),需將老版本完全卸載,重啟機(jī)器后安裝最新版本即可。

四:PageRank的重要性
搜索引擎網(wǎng)站排名算法中的各排名因子的重要性均取決于它們所提供信息的質(zhì)量。但如果排名因子具有易操縱性,則往往會(huì)被一些網(wǎng)站管理員利用來實(shí)現(xiàn)不良競(jìng)爭(zhēng)。例如初引入的排名因子之一--關(guān)鍵詞元標(biāo)識(shí)(Meta Keywords),是由于理論上它可以很好地概括反映一個(gè)頁(yè)面的內(nèi)容,但后來卻由于一些網(wǎng)站管理員的惡意操縱而不得不黯然退出。所以“加權(quán)值”--即我們對(duì)該因子提供信息的信任程度是由排名因子的易操縱程度和操縱程度共同決定的。

PageRank無疑是頗難被操縱的一個(gè)排名因子了。但在它最初推出時(shí)針對(duì)的只是鏈接的數(shù)量,所以被一些網(wǎng)站管理員鉆了空子,利用鏈接工廠和訪客簿等大量低劣外部鏈接輕而易舉地達(dá)到了自己的目的。Google意識(shí)到這個(gè)問題后,便在系統(tǒng)中整合了對(duì)鏈接的質(zhì)量分析,并對(duì)發(fā)現(xiàn)的作弊網(wǎng)站進(jìn)行封殺,從而不但有效地打擊了這種做法,而且保證了結(jié)果的相關(guān)性和精準(zhǔn)度。

五:Google的前1,000項(xiàng)搜索結(jié)果
一般說來,網(wǎng)站排名因素包括網(wǎng)頁(yè)標(biāo)題(META TITLE),網(wǎng)頁(yè)正文中的關(guān)鍵詞密度,錨文本(也叫鏈接文本,指鏈接或超鏈的文本內(nèi)容)和PageRank所決定的。

請(qǐng)記住:單靠PageRank是無法使你獲得比較理想的網(wǎng)站排名的。PageRank只是網(wǎng)站排名算法中的一個(gè)乘積因子,若你網(wǎng)站的其它排名因子的得分是零,就算你的PageRank是兩百億,最后的得分還是零。但這并不是說PageRank就毫無價(jià)值,而是在什么情況下PageRank才能完全發(fā)揮其功力。

如果在Google上進(jìn)行廣泛搜索,看起來好象有幾千個(gè)結(jié)果,但實(shí)際顯示最多前1,000項(xiàng)結(jié)果。例如對(duì)“car rental”,顯示搜索結(jié)果為5,110,000,但實(shí)際顯示結(jié)果只有826個(gè)。而且用時(shí)只有0.81秒。試想一下,0.84秒的時(shí)間就可以計(jì)算這五百萬搜索結(jié)果的每個(gè)排名因子得分,然后給出最終我們所看到的網(wǎng)站排名結(jié)果嗎?

答案就在于:搜索引擎選取與查詢條件最相關(guān)的那些網(wǎng)頁(yè)形成一個(gè)子集來加速搜索的速度。例如:假設(shè)子集中包含2,000個(gè)元素,搜索引擎所做的就是使用排名因子中的兩到三個(gè)因素對(duì)整個(gè)數(shù)據(jù)庫(kù)進(jìn)行查詢,找到針對(duì)這兩三個(gè)排名因子得分較高的前2,000個(gè)網(wǎng)頁(yè)。(請(qǐng)記住,雖然可能有五百多萬搜索結(jié)果,但最終實(shí)際顯示的1,000項(xiàng)搜索結(jié)果卻是從這個(gè)2,000頁(yè)的子集中提煉出來的。) 然后搜索引擎再把所有排名因子整合進(jìn)這2,000項(xiàng)搜索結(jié)果組成的子集中并進(jìn)行相應(yīng)的網(wǎng)站排名。由于按相性進(jìn)行排序,子集中越靠后的搜索結(jié)果(不是指網(wǎng)頁(yè))相關(guān)性(質(zhì)量)也就越低,所以搜索引擎只向用戶顯示與查詢條件最相關(guān)的前1,000項(xiàng)搜索結(jié)果。

請(qǐng)注意,在搜索引擎生成這2,000項(xiàng)網(wǎng)頁(yè)的子集中我們強(qiáng)調(diào)了“相關(guān)性”這個(gè)詞。即搜索引擎找尋的是與查詢條件有共同主題的網(wǎng)頁(yè)。如果這時(shí)候我們把PageRank考慮進(jìn)去,就很可能得到一些PageRank很高但主題只是略微相關(guān)的一些搜索結(jié)果。顯然這有違搜索引擎為用戶提供最為相關(guān)和精準(zhǔn)的搜索結(jié)果的原則。

一旦理解了為什么會(huì)如此,就說明了為什么你應(yīng)當(dāng)首先努力在“頁(yè)面”因子和錨文本上下足工夫,最后才是PageRank。所以關(guān)鍵在于:

你必須首先在頁(yè)面因素和/或錨文本上下足工夫,使這些排名因子能夠獲得足夠的得分,從而使你的網(wǎng)站能夠按目標(biāo)關(guān)鍵詞躋身于這2,000項(xiàng)搜索結(jié)果的子集中,否則PageRank再高也與事無補(bǔ)。

六:PageRank和其它排名因子之間的不同

網(wǎng)頁(yè)Title標(biāo)識(shí) 僅能被列出一次。
正文中的關(guān)鍵詞 連續(xù)的重復(fù)只會(huì)降低關(guān)鍵詞的重要性,重要的是接近度。
錨文本 加權(quán)值極高,但存在上限,超過上限的錨文本信息將被忽略或降低權(quán)值。
PageRank 潛質(zhì)無窮,沒有上限的限制,但需要大量工作。
備注 其它排名因子都存在一個(gè)上限(闕值),超過上限部分其權(quán)值將降低或不再計(jì)分。PageRank則不存在此問題。

Google--PageRank(網(wǎng)頁(yè)級(jí)別)技術(shù)解密(二)

7. 非PageRank因素闕值
8. 使用闕值推知兩種排名策略的價(jià)值
9. PageRank的計(jì)算

七:非PageRank因子的上限闕值(Non-PageRank Factor Threshold)
除了PageRank外,其它排名因子都存在一個(gè)闕值,也叫臨界值或差值。即當(dāng)增長(zhǎng)到一定值時(shí),因子的重要性反而開始慢慢降低,則該值就是非PageRank因子的闕值。

設(shè)闕值為1,000,如果網(wǎng)頁(yè)A和B是我們對(duì)某一查詢條件的其中兩個(gè)查詢結(jié)果,且A的總分?jǐn)?shù)(包括頁(yè)面因子得分和PageRank得分)是900,B是500,則顯然A會(huì)排在B的前面。但由于A和B的分?jǐn)?shù)均低于我們上面假設(shè)的非PageRank因子闕值,因而在不改變PageRank的情況下,我們可以通過對(duì)B頁(yè)進(jìn)行精心的頁(yè)面優(yōu)化使頁(yè)面因子分?jǐn)?shù)得到提高來使其排名超過A。但如果A的總得分升至1,100分,則B若還只是一味優(yōu)化頁(yè)面因子是遠(yuǎn)遠(yuǎn)不夠的。在這種情況下,提升PageRank就成為首要任務(wù)了。

一般說來,Google的查詢結(jié)果頁(yè)中既可能包含一些分?jǐn)?shù)超過闕值的網(wǎng)頁(yè),也可能包含一些分?jǐn)?shù)低于闕值的網(wǎng)頁(yè)。所以:

為了提高競(jìng)爭(zhēng)能力,必須在闕值范圍內(nèi)盡可能提高頁(yè)面的搜索引擎排名得分,否則會(huì)降低頁(yè)面的競(jìng)爭(zhēng)力。“頁(yè)面因子”是接近和達(dá)到闕值最迅捷的方式,它與PageRank的結(jié)合使用才是提升網(wǎng)站排名得分的最佳優(yōu)化策略。

八:使用闕值推知兩種排名策略的價(jià)值
闕值解釋了搜索引擎商所遵循的原則和不同的實(shí)施途徑,同時(shí)亦闡述了為什么會(huì)產(chǎn)生關(guān)于PageRank的一些誤解。我們可以把這兩種策略當(dāng)成兩個(gè)人A和B。

A認(rèn)為“PageRank”并不重要。他們已有數(shù)年網(wǎng)頁(yè)優(yōu)化經(jīng)驗(yàn)并知道如何完美地利用“頁(yè)面因素”來達(dá)到優(yōu)化的目的。他們亦理解基本的錨文本,但對(duì)PageRank得分毫不在意。結(jié)果如何呢?由于最大化地使用了“頁(yè)面因子”,從而使A迅速達(dá)到“非PageRank因子的闕值”。所以通過精心選擇關(guān)鍵詞可使他們獲得較好的網(wǎng)站排名。而且只要網(wǎng)站內(nèi)容比較好,隨著時(shí)間推移總會(huì)有排名高的站點(diǎn)鏈接,涓涓細(xì)流匯成河。A最后亦得到了PageRank得分,并籍此鞏固了排名。

B認(rèn)為“PageRank”十分重要。他掌握了很多關(guān)于提升PageRank得分的信息,并為提高該得分下足了工夫。結(jié)果又如何呢?B的做法和A相反,但A在非PageRank因子上下工夫,結(jié)果卻得到了PageRank得分。而B在PageRank因子上下工夫,結(jié)果卻得到非PageRank因子得分。究其原因,就是由于提高PageRank得分需要外部鏈接,鏈接又具有錨文本,從而通過精心挑選外部鏈接的錨文本,B自發(fā)提高了其非PageRank因子的得分,從而贏得了較高的PageRank得分。

雖然這只是兩個(gè)極端,但我們可以利用它們來推知這兩種途徑各自的優(yōu)缺點(diǎn):

對(duì)象
優(yōu)點(diǎn)
缺點(diǎn)
A:忽略PageRank
  • 網(wǎng)站排名在短期內(nèi)就可得到提升
  • 自我生成鏈接節(jié)省了工作量
  • 需投入大量工作維持網(wǎng)站排名
  • 對(duì)新競(jìng)爭(zhēng)者的應(yīng)變速度較慢
  • B:忽略頁(yè)面排名因子
  • 可獲得可靠網(wǎng)站排名,并可在需要時(shí)輕松修改頁(yè)面因素使排名迅速提升
  • 極可能從非搜索類引擎來源上獲得更高訪問量
  • 網(wǎng)站排名提升較慢
  • 操作難度較大
  • 容易為SPAM過濾程序所制


  • 對(duì)象 優(yōu)點(diǎn) 缺點(diǎn)
    A:忽略PageRank 網(wǎng)站排名在短期內(nèi)就可得到提升

    自我生成鏈接節(jié)省了工作量
    需投入大量工作維持網(wǎng)站排名

    對(duì)新競(jìng)爭(zhēng)者的應(yīng)變速度較慢

    B:忽略頁(yè)面排名因子 可獲得可靠網(wǎng)站排名,并可在需要時(shí)輕松修改頁(yè)面因素使排名迅速提升

    極可能從非搜索類引擎來源上獲得更高訪問量
    網(wǎng)站排名提升較慢

    操作難度較大

    容易為SPAM過濾程序所制

    事實(shí)上,我們前面說過,最終排名得分=所有非PageRank因子實(shí)際得分x實(shí)際PageRank得分。亦即二者相輔相成,再加上隨著網(wǎng)上營(yíng)銷方式的發(fā)展壯大,關(guān)鍵詞的競(jìng)爭(zhēng)也變的愈來愈激烈,這種情況下只靠非PageRank因子得到好排名顯然是不可能的。而且非PageRank因子存在著闕值的局限性。同時(shí),對(duì)于競(jìng)爭(zhēng)性極高的關(guān)鍵詞,還存在著PageRank下限的問題。也就是說,除非網(wǎng)站的PageRank得分超過這個(gè)下限標(biāo)準(zhǔn),否則網(wǎng)站排名很難上去。PageRank的下限由關(guān)鍵詞的競(jìng)爭(zhēng)度所決定。競(jìng)爭(zhēng)性一般的關(guān)鍵詞PageRank下限也不高,而對(duì)競(jìng)爭(zhēng)較為激烈的關(guān)鍵詞來說,它所要求的PageRank下限相應(yīng)就要高。而PageRank得分的提升又非常有難,這時(shí)候非PageRank因子就變的非常重要了。
    綜上所述:我們需要充分發(fā)揮各排名因子的優(yōu)勢(shì)來贏取理想的綜合排名得分。同時(shí)關(guān)鍵詞(競(jìng)爭(zhēng)度適宜)的精心選擇亦變的非常重要,它可以節(jié)省大量的支出。九:PageRank的計(jì)算方法
      PageRank (A) = (1-d) + d(PageRank (T1)/C(T1) + ... + PageRank (Tn)/C(Tn))
      其中PageRank (A)表示給定頁(yè)面A的PageRank得分;
      D為阻尼因子,一般設(shè)為0.85;
      PageRank (T1)表示一個(gè)指向A頁(yè)的網(wǎng)站其本身的PageRank得分;
      C(T1)表示該頁(yè)面所擁有的導(dǎo)出鏈接數(shù)量;
      PageRank (Tn)/C(Tn)表示為每一個(gè)指向A頁(yè)的頁(yè)面重復(fù)相同的操作步驟。

    事實(shí)上,計(jì)算某個(gè)頁(yè)面的PageRank得分需要大量繁復(fù)計(jì)算。例如若計(jì)算A頁(yè)的PageRank得分則首先要知道所有鏈至A頁(yè)的網(wǎng)頁(yè)(導(dǎo)入鏈接)的PageRank得分。要想知道這些外部鏈接頁(yè)的PageRank得分,又需要先知道這些頁(yè)面的外部鏈接的PageRank得分,等等。我們只需要知道:

    A頁(yè)的外部鏈接B能夠帶給A的PageRank得分與B的導(dǎo)出鏈接數(shù)量成反比,即隨著B上導(dǎo)出鏈接數(shù)的增加,帶給A的PageRank得分亦隨之降低。這同樣表明了一個(gè)網(wǎng)頁(yè)的PageRank得分是該網(wǎng)頁(yè)對(duì)其它頁(yè)面投票的一個(gè)基本的度量形式。一個(gè)網(wǎng)頁(yè)可以投票給一個(gè)或多個(gè)導(dǎo)出鏈接,但其總投票權(quán)一定,并被平均分配給所有的導(dǎo)出鏈接。假設(shè)B的PageRank得分是5,且B上只有一條指向A的鏈接,那么A將獲得B全部的PageRank得分(B沒有損失任何東西,而A贏得了B的PageRank得分)。但如果B上有N個(gè)鏈接,則A只能得到B的PageRank得分的N分之一。

    我們可以用圖表來闡述其工作原理。假設(shè)有四個(gè)網(wǎng)頁(yè)A,B,C和D,它們相互鏈接,如表-1所示:

    表-1:鏈接前的PageRank得分


    表-2:鏈接后的PageRank得分

    假設(shè)這四個(gè)網(wǎng)頁(yè)初始PageRank得分均為0。則根據(jù)上面的公式它們的PageRank得分都是0.15。我們計(jì)算一下鏈接后各自的PageRank得分情況。
    1.A鏈向B、C和D。A的初始PageRank得分是0.15,所以A的導(dǎo)出鏈接獲得PageRank得分總數(shù)為 0.85 * 0.15 = 0.1275。B,C和D三個(gè)網(wǎng)頁(yè)各得0.0425分。
    2.B鏈向C、B的初始PageRank得分也是0.15,所以其唯一鏈接頁(yè)面C所能夠獲得的PageRank得分是0.85 * 0.15 = 0.1275分。
      C鏈向A,其0.1275的PageRank得分傳遞給唯一鏈接對(duì)象A。
      D鏈向C,其0.1275的PageRank得分傳遞給了C。
      現(xiàn)在各網(wǎng)頁(yè)的PageRank得分結(jié)果如下:
      A:0.15 + 0.1275 (得自C) = 0.2775
      B:0.15 + 0.0425 (得自A) = 0.1925
      C:0.15 + 0.0425 (得自A) + 0.1275 (得自B) + 0.1275 (得自D) = 0.4475
      D:0.15 + 0.0425 (得自A) = 0.1925(如表-2所示)
    繼續(xù)這樣的計(jì)算,直到每個(gè)頁(yè)面的數(shù)值逼近一個(gè)定值(PageRank屬收斂函數(shù))。最后可以發(fā)現(xiàn),C的PageRank最高。而且外部鏈接的數(shù)量顯著地改變了PageRank得的分布。

    表-3:最后的PageRank得分結(jié)果

    表-4:外部鏈接與PageRank得分對(duì)照表:

     
    導(dǎo)入鏈接
    數(shù)量
    導(dǎo)出鏈接
    數(shù)量
    最終PageRank得分
    C
    A/B/D
    3
    A
    1
    1.4860614724
    A
    C
    1
    B/C/D
    3
    1.4131522515
    B
    A
    1
    C
    1 0.5503931379
    D
    A
    1
    C
    1 0.5503931379


    十四:網(wǎng)站的內(nèi)部結(jié)構(gòu)和聯(lián)接

    一:網(wǎng)站的內(nèi)部頁(yè)面
    說完了“外部鏈接”,現(xiàn)在讓我們來看看“內(nèi)部鏈接”。如果PageRank確由頁(yè)面投票的質(zhì)量和數(shù)量所決定,那么我們立即就可以得出網(wǎng)站內(nèi)鏈與PageRank的關(guān)系的一個(gè)重要結(jié)論:

    網(wǎng)站上每個(gè)已被Google收錄的內(nèi)部網(wǎng)頁(yè)(內(nèi)鏈)都是對(duì)該網(wǎng)站的一記投票,不過投票份量很小。因而,一個(gè)網(wǎng)站若能擁有更多已被Google收錄的內(nèi)部網(wǎng)頁(yè),就有可能獲得更多的總投票。

    這樣一來,我們可以通過創(chuàng)建大量?jī)?nèi)部網(wǎng)頁(yè)來提高網(wǎng)站整體的PageRank。但這還遠(yuǎn)遠(yuǎn)不夠。因?yàn)槲覀兇颂幩傅膬?nèi)部網(wǎng)頁(yè)是指已被Google收錄,即擁有自己的PageRank的那些內(nèi)鏈頁(yè)面。這些網(wǎng)頁(yè)之所以被Google檢索是由于它們具備豐富充實(shí)的內(nèi)容。所以應(yīng)盡力充實(shí)和豐富你的網(wǎng)站,一旦網(wǎng)站內(nèi)容得到充實(shí)和豐富,會(huì)有更多的內(nèi)頁(yè)得到檢索,從而帶來更多的PageRank。同時(shí)“升值”的網(wǎng)站也會(huì)獲得更多站點(diǎn)的青睞,從而會(huì)有更多的站點(diǎn)主動(dòng)鏈接你。

    簡(jiǎn)言之,就提升PageRank而言,對(duì)“內(nèi)”最需要做的就是為網(wǎng)站填充更加豐富和有價(jià)值的內(nèi)容。應(yīng)確保網(wǎng)頁(yè)內(nèi)容不會(huì)過長(zhǎng)或過短,如有必要可將網(wǎng)頁(yè)內(nèi)容分割成若干網(wǎng)頁(yè)。

    二:網(wǎng)站的內(nèi)部結(jié)構(gòu)&聯(lián)接
    網(wǎng)站有三種內(nèi)部聯(lián)方式,宜結(jié)合使用這三種聯(lián)接方式進(jìn)行網(wǎng)站的建設(shè)。假設(shè)一個(gè)網(wǎng)站由“主頁(yè)”,“關(guān)于我們”頁(yè),“產(chǎn)品介紹”頁(yè)和“更多信息”頁(yè)這四個(gè)頁(yè)面組成,通過下表我們可以看出每種結(jié)構(gòu)對(duì)網(wǎng)站PageRank的影響度。

    表-11:層級(jí)結(jié)構(gòu)(Hierarchical)

    表-12:環(huán)路網(wǎng)站結(jié)構(gòu)(Looping)

    表-13:內(nèi)頁(yè)廣泛互聯(lián)的網(wǎng)站結(jié)構(gòu)(Extensive Interlinking)

    表14-16是內(nèi)部頁(yè)面在不同結(jié)構(gòu)網(wǎng)站上的PageRank分布情況。了解了這一點(diǎn)我們就可以從“內(nèi)部鏈接”著手來獲得最大的PageRank反饋。

    世紀(jì)創(chuàng)聯(lián)


    Copyright© 2004-2020 河南海騰電子技術(shù)有限公司 版權(quán)所有   經(jīng)營(yíng)性ICP/ISP證 備案號(hào):B1-20180452   豫公網(wǎng)安備 41019702002018號(hào)    電子營(yíng)業(yè)執(zhí)照