鏈路距離排序算法

鏈路距離排序算法

搜尋聖經:

有一種鏈接算法沒有被廣泛討論,但還不夠。 本文旨在介紹鏈接和鏈接距離排名算法。 這可能會在網站排名方面發揮作用。 在我看來,重要的是要意識到這一點。

Google會使用此功能嗎?

雖然正在考慮的算法來自谷歌提交的專利,谷歌關於專利和研究論文的官方聲明是,他們生產了許多專利和研究論文,但並非所有這些都被使用,有時它們的使用方式不同於所描述的內容。

也就是說,這個算法的細節似乎與穀歌正式談到它如何處理鏈接的輪廓相似。

計算的複雜性

該專利有兩個部分( 在Web鏈接圖中使用距離生成頁面排名 ),說明計算的複雜程度:

“不幸的是,PageRank的這種變化需要分別為每個種子解決整個系統。 因此,隨著種子頁數的增加,計算的複雜性線性增加,從而限制了實際使用的種子數量。“

因此,需要一種使用大量多樣化種子頁面為網頁上的頁面產生排名的方法和裝置……“

以上指出由於數據點數量眾多而難以在網路上進行這些計算。 它指出,通過主題利弊打破這些,計算更容易計算。

該聲明的有趣之處在於,原始企鵝算法每年計算一次或更長時間。 受到懲罰的網站幾乎都受到了懲罰,直到谷歌重新計算企鵝得分的下一個看似隨機的日期。

在某個時刻,Google的基礎設施必須得到改善。 谷歌不斷建立自己的基礎設施,但顯然沒有公佈。 Caffeine Web索引系統是例外之一。

實時企鵝在2016年秋季推出。

值得注意的是,這些計算很困難。 它指出Google可能會對整個網站進行定期計算,然後根據從受信任網站到所有其他網站的距離來分配分數。 因此,一個巨大的計算,做了一年。

因此,當通過PageRank計算SERP時,也會計算距離分數。 這聽起來很像我們稱為企鵝算法的過程。

“然後,系統根據鏈接的屬性和鏈接所附頁面的屬性為鏈接分配長度。 系統接下來基於頁面之間的鏈接的長度來計算從種子頁面集合到頁面集合中的每個頁面的最短距離。 接下來,系統基於所計算的最短距離確定該組頁面中的每個頁面的排名分數。“

系統在做什麼?

系統建立基於種子集與建議的排名頁面之間的最短距離的分數。 該分數用於對這些頁面進行排名。

所以它基本上是在PageRank得分之上的疊加,以幫助清除被操縱的鏈接,基於操縱鏈接自然會在垃圾郵件頁面和可信集之間具有更長的鏈接連接距離的理論。

對網頁進行排名可以說包括三個過程。

  • 索引
  • 排行
  • 排名修改(通常與個性化相關)

這是排名過程的極端減少。 還有很多事情要發生。

有趣的是,這個距離排名過程發生在過程的排名部分。 在此算法下,除非頁面與種子集相關聯,否則沒自然搜尋會對有意義的短語進行排名。

這是它說的:

“減少這些技術影響的PageRank的一個可能的變化是選擇一些”可信“頁面(也稱為種子頁面)並通過跟踪來自可信頁面的鏈接發現可能是好的其他頁面“。

這是一個重要的區別,要知道種子集計算在排名過程的哪個部分發生,因為它有助於我們制定我們的排名策略。

這與Yahoo TrustRank不同。 YTR被證明有偏見。

Majestic的Topical TrustFlow可以說是一個改進版本,類似於一篇研究論文,證明通過使用由利基主題組織的種子集更準確。 研究還表明,按主題組織種子集算法比不這樣做要好幾個順序。

因此,谷歌的距離排名算法也可以通過利基主題桶來組織它的種子集。

據我了解,此Google專利計算種子集之間的距離並指定距離分數。

減少鏈接圖

“在該實施例的變型中,與計算的最短距離相關聯的鏈路構成簡化的鏈路圖。”

這意味著有一個互聯網地圖,通常稱為鏈接圖,然後是一個較小的版本,鏈接圖由填充了垃圾郵件頁面的網頁填充。 主要獲取簡化鏈接圖之外的鏈接的網站可能永遠不會進入。 因此,臟鏈接沒有牽引力。

什麼是精簡鏈接圖?

我會保持這簡短而甜蜜。 該文件的鏈接如下。

你真正需要知道的是這部分:

“基於鏈接的排名算法的早期成功是基於鏈接意味著目標頁面的優點的假設。 但是,今天存在許多鏈接而不是賦予權力。 這種鏈接會將噪聲帶入鏈接分析並損害檢索質量。

為了提供高質量的搜尋結果,檢測它們並減少它們的影響是很重要的……借助於分類器,可以檢測和丟棄這些噪聲鏈路。 之後,在簡化鏈接圖上執行鏈接分析算法。“

有關精簡鏈接圖的更多信息,請閱讀此PDF。

如果您從新聞機構等網站獲取鏈接,可以公平地假設它們位於簡化鏈接圖的內部。 但它們是種子集的一部分嗎? 也許我們不應該為此著迷。

這是為什麼谷歌說負面的搜尋引擎優化不存在?

“……與計算出的最短距離相關聯的鏈接構成了簡化的鏈接圖”

簡化鏈接圖與鏈接圖不同。 鏈接圖可以說是由站點,頁面甚至頁面的部分之間的鏈接關係組織的整個因特網的映射。

然後是一個簡化的鏈接圖,它是一個地圖,減去某些不符合特定標準的網站。

縮小的鏈接圖可以是網路地圖減去非垃圾網站。 簡化鏈接圖之外的網站對鏈接圖內的網站沒有任何影響,因為它們位於外部。

這可能是鏈接到普通網站的垃圾網站不會對非垃圾網站造成負面影響的原因。 由於垃圾網站位於簡化鏈接圖之外,因此無效。 該鏈接被忽略。

這可能就是為什麼谷歌如此自信,它正在捕捉鏈接垃圾郵件和負面的搜尋引擎優化不存在?

種子集的距離等於排名較低?

我認為沒有必要嘗試繪製種子集的內容。 在我看來,更重要的是要了解主題社區以及與獲取鏈接的位置有何關聯。

谷歌曾經一度公開顯示每個頁面的PageRank分數,因此我記得哪些類型的網站往往得分較低。 有一類網站具有較低的PageRank和較低的Moz DA,但它們與我認為可能距離種子集幾次點擊的網站密切相關。

Moz DA測量的是網站權威的近似值。 這是一個很好的工具。 但是,Moz DA所測量的內容可能與種子集的距離不同,因為它是谷歌的秘密而無法知曉。

所以我不會放下Moz DA工具,繼續使用它。 我只是建議您可能希望擴展您的標準和有用鏈接的定義。

靠近種子集是什麼意思?

斯坦福大學的課堂文件 ,第17頁詢問,接近的好概念是什麼? 答案是:

  • 多個連接
  • 連接質量
  • 直接和間接連接
  • 長度,度,重量

這是一個有趣的考慮因素。

帶走

有很多人擔心錨文本比率,入站鏈接的DA / PA,但我認為這些考慮有點舊。

對DA / PA的關注是對從PageRank為4或更高的頁面獲取鏈接的煩惱的回歸,這是一種從隨機選擇的PageRank得分(第四位)開始的做法。

當我們在排名的背景下討論或考慮鏈接時,將距離排名視為該對話的一部分可能是有用的。

在這裡閱讀專利
https://www.Google.com/patents/US9165040

Shutterstock的圖片,作者修改

Close Menu