Seznam SEO:採訪Seznam的搜尋部門主管

Seznam SEO:採訪Seznam的搜尋部門主管

搜尋聖經:

眾所周知,Google並不是全球用戶唯一使用的搜尋引擎,並且面臨來自

然而,另一個搜尋引擎與穀歌競爭 – 大多數情況下,很多SEO專業人士從未遇到過,因為它僅限於捷克市場搜尋引擎,如果不是更頻繁的話。 然而,自2010年以來,谷歌在市場上獲得了更多的支配地位,現在是主導者。

與其他市場不同,Seznam及其各種產品仍然擁有相當大的市場份額(約佔搜尋市場的30%,每天處理1500萬個查詢)。

進入捷克時,仍需要考慮優化發動機。

對於任何與穀歌競爭的搜尋引擎,能夠理解你如何接近戰斗在你自己的批判性思維和思維過程中是有用的(作為一個搜尋引擎優化)。

Seznam SEO:採訪Seznam的搜尋部門主管Seznam的搜尋部主任TomášPergler

為了深入了解Seznam的方法,我很幸運地向Seznam的搜尋部門主管TomášPergler詢問了Seznam的現代搜尋方法以及他們的搜尋引擎如何處理現代JavaScript驅動的網站。

許多外部消息來源稱Seznam佔捷克搜尋引擎市場11%的市場份額,低於2010年1月的約30%.Seznam在市場中的份額如何? Dusan Janovsky Google競爭。

今年年初,廣告公司Evisions發布了關於客戶如何使用Google和Seznam的案例研究 。 它只在捷克,但我相信你將能夠理解圖表。

當我們(作為SEO專業人士)談論優化網站時,我們傾向於關註三個核心領域,即反向鏈接, 技術和內容。 在沒有洩露Seznam算法的秘密的情況下,您能否告訴我們Seznam如何歸因於 這些因素並建立其排名系統?

TP:在某種抽象層面,我們打破了相關性問題,並將其排列為三個基本維度:準確性,實用性和質量。

  • 準確性處理用戶查詢的內容,文檔或網站的內容以及它們彼此對應的程度。
  • 實用性意味著給定結果對大多數用戶有用。 一些結果可能是準確但無用的 – 缺貨產品,過時的新聞,缺少正文等。
  • 質量涉及可用性,導航,信息結構和可信度。 一些結果可以準確有用但質量低。

基本上,我們獨立地對所有三個維度中的每個文檔或查詢文檔進行分類。

準確性和有用性是基於查詢文檔的,因此需要在查詢時間內對其進行評估。

可以在下載文檔後立即評估質量,因為它只是基於文檔的分類。

每個分類器都使用特定功能:

  • 鏈接圖功能對於實用性和質量至關重要。
  • 正文文本大小是有用的重要功能之一。 在大多數情況下,空體文本是無用的。
  • HTTPS對質量有一定的重要性。
  • 用戶反饋功能對於預測質量非常有用。
  • 基於字典的功能對於實用性和質量很有用。

在SERP中可見的結果已經準確且有用,因此我們主要根據質量對它們進行排序。

反向鏈接對我們來說具有全面的重要性。 每個維度以不同的方式使用它們。 在預測準確性時,我們需要找出頁面或網站的內容。

反向鏈接包含有關用戶如何記住網站的信息。 來自高訪問頁面的錨文本的信息很有價值,因為很多人使用它來進行導航。

這就是為什麼我們需要反向鏈接來進行導航查詢。 但是,更多的反向鏈接並不意味著更準確。

實用性完全是另一項任務。 這裡的鏈接圖功能很強,這就是為什麼鏈接在SEO中工作的原因。 但它不應該只是更多的反向鏈接=更好的排名。

從歷史上看,我們已經使用了一些機制來預測哪些鏈接是好的或自然的,哪些是壞的,但這是一項非常複雜的任務,可能有更好的方法。

來自高度可靠網站的直接和間接鏈接可以積極影響目標的質量得分。 高度可信的網站通常不會出售反向鏈接; 因此它們提供信任,通過鏈接圖傳播。

在處理準確性時,內容本身是最容易獲得的信息來源。 它基本上告訴我們頁面的內容。

頁面標題和高級正文提取是必不可少的。 我們使用類似BM25的評分功能,我們專注於捷克語。

Seznam在處理JavaScript網站方面有多大能力?

TP:我們已經嘗試了一段時間的網頁渲染 – 幾年前SERP中的每個片段都包含一個頁面縮略圖(它只是一個“設計”功能)。

現在我們使用網頁呈現來更好地理解網頁的內容和佈局。

目前它仍然僅在少量爬行時完成,主要用於新聞文章。 從渲染頁面,我們可以非常準確地提取其主要文本,主要圖像或文章發布日期。

將來,我們希望增加和平衡呈現的抓取流量與爬網程序的抓取預算消耗的比率。

現在,與一個未呈現爬網的GET請求相比,一個網頁的平均渲染爬網消耗了數十個GET請求。

我們使用最新的穩定chrome版本(目前為73.x)進行頁面呈現,這意味著我們的抓取工具獲得與真實用戶相同的結果。

在Seznam的排名決定中,移動可用性有多大?

TP:我們的實際質量分類器目前不區分台式機和移動設備,但我們正在準備新的質量等級。

我們的評估員將直接在他們的手機上評定質量。 基於這種數據,我們可能會發現一些新功能。 我們計劃將它們納入我們的排名模型,直到2019年第三季度末。

Seznam多久更新一次排名標準/算法?

TP:去年我們完全重建了我們的主要相關模型。 一旦。 然後一年中有一些小調整。

我們的團隊已經成長,今年我們想要更快。

Seznam如何處理國際網站(即包含多種語言版本的網站)?

TP:搜尋引擎爬蟲SeznamBot專注於我們的用戶可能搜尋的頁面。 這意味著它首先用捷克語挖掘網頁。

SeznamBot還抓取其他頁面以允許搜尋引擎回答“全局”查詢 – 例如:導航到國際站點,全球公司,節目,影音,社交等等,因此它也會抓取國際網路。

如果某個網站在同一網址上以多種語言提供內容,則抓取工具只能獲得一種語言版本 – 最好是捷克語。

如果語言版本可以通過不同的URL訪問,那麼SeznamBot可以抓取幾個語言版本的頁面 – 例如,捷克語,斯洛伐克語和英語的維基百科上的相同內容。

SeznamBot是否會面臨抓取非捷克網站的任何問題?

TP:不幸的是,我們在抓取國際網路時遇到嚴重的訪問問題。 越來越多的網站往往會阻止除GoogleBot之外的所有流量。

例如,我們最近與ProjectHoneyPot.org進行了溝通,將我們的抓取工具的IP列入白名單,因為SeznamBot是一個標準的搜尋引擎抓取工具,阻止它不會帶來任何好處。

如果這篇文章有助於鼓勵網站管理員允許SeznamBot訪問他們的網站,那將會很棒,因此它可能會帶來捷克共和國用戶的一些訪問。

或者至少向他們展示,在他們網站上的robots.txt文件的評論部分中建立技術聯繫人是有幫助的。

遠離搜尋片刻,Seznam的其他資產(如Novinky,Sreality,Mapy)有多受歡迎?

TP: Seznam.cz佔捷克互聯網用戶的95%。 每天有超過350萬人訪問我們的主頁,在兩年內,我們每天在SeznamZpravy.cz(我們自己的新聞服務)上獲得了近百萬訪客。

我們更廣泛產品的一些亮點包括:

  • Email.cz – 電子郵件服務每天為7150萬封電子郵件提供便利。
  • Firmy.cz – Firmy是一個結構化的企業目錄,包含聯繫信息和評論,列出了超過670,000家公司。
  • Kupi.cz – 在線折扣/優惠券代碼目錄,每天有超過10,000折扣和300個廣告傳單。
  • Mapy.cz – 地圖提供商,在旅遊季節,每天可以達到100萬用戶。
  • Novinky.cz – 最受歡迎的在線捷克新聞網站,擁有57%的在線新聞閱讀市場份額。
  • Sport.cz – 捷克共和國訪問量最大的體育網站,每天有超過1,600篇文章和160個在線流媒體。
  • Stream.cz – 一種在線電視流媒體服務,每月觀看次數超過3500萬次。

更多資源:


圖片來源

來自ihned.cz的 Tomas Pergler圖片,2019年4月

還要感謝Seznam,TomášPergler和AnetaKapuciánová為採訪提供便利。

Close Menu