SEO 指南二:搜尋引擎的原理與 SEO 排名淺規則
賴彤兒(Tony)
By: 賴彤兒(Tony)

SEO 指南二:搜尋引擎的原理與 SEO 排名淺規則

了解 SEO 的用途與目標後,我們正式進入 SEO 領域的基礎,這個章節會介紹 SEO 最核心的知識:搜尋引擎原理、排名核心原則,藉此建構搜尋引擎優化的基礎知識。需要先說明的是,這個章節將會圍繞在「觀念」的闡述上,針對各種實作經驗,在後續章節才會完整說明,後面章節將會大量用到本章的基礎知識,請務必在這個章節認識相關基礎。

「搜尋」是現代人絕不陌生的行為,遇到事情先問 Google,是許多數人的習慣。而搜尋這件事,也正是 SEO 的開端:從使用者在搜尋引擎中輸入關鍵字開始 Google 將會根據演算法從資料庫中決定各網站排名,最後回傳搜尋結果頁(SERP)給使用者。SEO 所做的目標,就是想要在第二步驟中,盡可能從演算法中取得高分,以取得更高的排名

#1 解決索引問題,才可能取得排名

想獲得排名,最基本的要求必須讓網站儲於引擎的資料庫當中。這個過程涉及兩個問題——「檢索」與「索引」:

搜尋引擎會經由「檢索」的過程,找出網路上的檔案,並進行「索引」將其規納入自身的資料庫當中。

  • 檢索(爬取):檢索是指搜尋引擎利用頁面中的連結,在網頁間一個一個走過,逐漸了解整個網站內容的過程,由於這個過程就像是在爬行一樣,因此被業界稱為「爬取」。在這個過程中,搜尋引擎將會確認網站中有多少頁面、程式碼、文字、圖檔⋯⋯,是認識網站的第一步驟
  • 索引(收錄):搜尋引擎爬取完網站之後,「通常」會將其放入引擎資料庫中,以供後續進行排名使用,這個過程稱為索引(收錄)。我們可以輕易地利用各大搜尋引擎的網站管理系統來查看收錄狀況,以 Google 來說,就可以從 Search Console 當中的涵蓋範圍就能清楚看出索引狀況
search console 示意圖

大家必須知道的是,如果網站沒有被索引,就等於不存在搜尋引擎的資料庫當中,也將不可能有排名,因此解決索引問題往往是 SEO 優化的第一課題,下方將針對常見的四種索引問題說明並告訴大家如何解決:

#1-1 引擎不是萬事通,有可能不知道你有網站了

大多數網站都是因為這個問題沒有被索引,我們只要主動告訴搜尋引擎網站在哪,就能改善這個問題。以 Google 來說,申請 Google Search Console,針對個別網頁提交索引需求,或者直接進行 Sitemap 提交,就能解決問題。(Sitemap 是指你的網站目錄,如果你沒有這個目錄,可以用 Sitemap產生工具 簡單生成,並在 SC 提交。額外補充,Sitemap 產生器網路上有很多,如果是用 WP 等內容管理器架設的網站,也有很多外掛可以生成,這個檔案的精緻對對優化影響極小,只要能夠提交就好,用什麼工具都可以。想了解更多請看:Sitemap 怎麼做?對 SEO 有用嗎?)

補充說明:Google Search Console 是一個很實用的網站管理工具,除了能夠提交網址與Sitemap,也包含查看排名統計、各項優化數據資料,Search console 的應用指南我們正在撰寫中。

其實,如果網站規模不大,並且內部連結設計合理,提不提交 Sitemap 影響不大,大可以只提交幾個網站的重要頁面:首頁、文章分類頁、產品分類頁,其他的就讓 Google 自行爬取就好,對 Google 而言,提交 Sitemap 僅僅是加快一點爬取的速度而已,並非必要性的。

另外,大多數的網站其實沒有做宣告與提交也會被 Google 找到,這是因為 Google 本身就會嘗試尋找有人觀看、分享、與存有外連的網站,因此,「提交」這個行為,更像是給剛起步的小網站快速通知 Google 使用的。

#1-2 無法爬取正確內容

上面我們提過搜尋引擎在索引之前,會進行爬取的動作,但並不是每個網站都適合爬取,如果網站本身採用的技術不適合,可能會導致 Google 機器人無法取得完整資訊,最典型的例子就是以 ajax 寫成的瀑布流內容(也就是頁面在網址不變動的過程中,不斷產生新內容的做法, Facebook 就是典型的代表),這種程式寫法對「爬取」過程相當不友善。

因此,在 SEO 實務上,大多會建議避免在重要內容中使用 JavaScript、ajax、flash⋯⋯等技術,尤其要避免用在:導覽列、麵包屑、產品目錄、文章列表⋯⋯等連結元素。雖然近年來 Google 不斷強化其爬取能力,對於多數 JavaScript 生成的內容也可以抓取了,但多一事不如少一事,可以用更好的方法解決時,沒有必要徒增自己的煩惱。

我們可以利用 Search Console 來檢查是否出現這個問題,直接進入 Search Console 進行網址檢查線上測試網址,就可以看到在 Google 眼中網站長什麼樣子,最關鍵的是檢查網站核心內容,是否出現在 Google 看到的代碼中

search console 提交網址

利用 Search Console 檢查網頁的好處是,能夠順便提交網頁,並且查看除了內容呈現之外的更多資訊。但如果要快速查詢時,也可以利用搜尋結果頁上的「頁庫存檔」功能,這是指 Google 對網頁進行的快取,它能在某種程度上反應 Google 如何看待這個網頁,找到網頁後選擇文字版,通常只要這裡呈現出主要內容,就表示 Google 對於爬取網站沒有太多困難。

頁庫存檔

使用頁庫存檔頁面最大的好處就是快,不用等 Search Console 慢慢跑,但這個頁面必須要在網站有被索引才可以查看,更多是用在檢查頁面中的重要內容,是否能夠被 Google 看到,對於有使用 JavaScript 技術的網站來說,是重要的檢查項目。

#1-3 內容沒有價值或重覆性太高

當網頁太過單薄,或者內容重覆性太高時(重複內容的解決方法請參考:網站 SEO 排名殺手,重複內容的解決大全),Google 可能會認為是垃圾網頁而不索引,遇到這種問題,該考慮的不是索引狀況,而是檢視自己網站中為什麼會有這種內容不足、重覆性高的頁面,調整這些問題,才是解決的根本之道

補充一點,如果 Google 因為內容重覆性過高而不索引網頁,其實並非壞事,因為重覆性內容將會造成網站整體權重下降,進而影響排名。在實際操作 SEO 的過程中,排除被索引的重覆頁面就是會使用的 SEO 手法

#1-4 網站經營者自行設定的宣告

有些程式標籤能夠拒絕 Google 索引網頁,這些標籤通常用在不想被搜尋到的網頁上,例如:我的帳戶、結帳頁、或者是還未開發完成的頁面⋯⋯。大多數情況這都是經營者自己設定的,但確實有開發商忘記刪除這些標籤,導致客戶在上線後的 3 個月完全沒有被索引的窘境(我們就遇過幾個客戶是這樣的情況),因此,檢查是否有錯誤的標籤也是相當重要的

在這裡,我們進階說明一下,如果不希望 Google 爬取,可以在網站跟目錄添加一個 robots.txt 的檔案,並對其宣告那些頁面不允許爬取,以下是程式寫法範例:

  • User-agent:填入搜尋引擎的值(* 號代表全部、Googlebot 代表 Google、bingbot 代表 Bing,其他搜尋引擎也有自己的代碼。)
  • Disallow:填入不希望被搜尋引擎檢索的頁面路徑( / 代表所有網頁,也可以個別輸入單一路徑下的全部頁面,例如:/admin/ 就會拒絕這個路徑下的網頁。)
  • Allow:允許爬取的網頁路徑,由於預設就是所有網頁,因此通常不用設定。

讓我們看幾個範例:

//範例一:阻止所有搜尋引擎檢索所有頁面
User-agent: *
Disallow: /
//範例二:只阻止Google引擎檢索所有頁面
User-agent: Googlebot
Disallow: /
//範例三:阻止所有引擎檢索 /admin/ 路徑下的全部頁面
User-agent: *
Disallow: /admin/

一般來說,工程師會在開發階段阻止所有引擎檢索所有頁面,在開發完成後通常只會禁止敏感資訊的頁面,例如:登入頁、購物車、個資相關頁面⋯⋯。

除了利用 robots.txt 檔案之外,也可以在該頁面宣告不希望被納入資料庫的程式碼,但不同的是,在頁面上的宣告是禁止納入資料庫,引擎還是會爬到這個網頁。最常使用的情況是希望引擎拿這個網頁當作跳板,但不要被搜尋到。

要做到這些事情,需要搭配兩個指令一起使用,分別是:noindex 標籤與 nofollow 標籤,index 是宣告要不要被索引,follow 則是宣告頁面上的連結要不要爬取。

在網頁區域的標籤設定:meta name=”robots” content=”noindex, nofollow” 就能夠拒絕引擎的存取與繼續爬取

這兩個指令搭配使用所產生的宣告邏輯如下:

// 範例一:沒有意義,因為預設值就是這個,所以這樣宣告等於沒有宣告
<meta name="robots"  content="index, follow">
// 範例二:這是告訴引擎,不要索引這個頁面,同時這個頁面下的連結也不要再繼續爬了。
<meta name="robots"  content="noindex, nofollow">
// 範例三:檢索資料時該頁面的相關連結不要檢索。
<meta name="robots"  content="index, nofollow">
// 範例四:這是最常使用的,就是不要索引這個頁面,但頁面上的連結可以繼續爬,也就是把這個頁面當作跳板就好。
<meta name="robots"  content="noindex, follow">

不過其實大多數在實作上沒有區分的這麼仔細,只會進行簡單的檢查,看看是不是有人為疏忽的狀況發生。

#2 排名順序的潛規則

「為什麼網站是這個排名?」這是所有學習 SEO 的人都應該有的疑問,但坦白說,沒有任何人敢說自己知道答案,因為 Google 本身也從未公開排名完整的演算法,最多只是告訴大家某些因素有影響,但影響力、重要性則從來沒有確認,這始終是個業界之謎。

在這樣的條件下,任何人提出的看法都不會是標準答案,我們也不例外。以下內容是我們多年學習與操作後的總結,如果大家看其他文章發現介紹方式與重視環節與我們不同,千萬不用奇怪,因為 SEO 領域的專家本來就應該有一套自己想法與經驗,你需要思考的是:這些觀點是否對你的網站有幫助?

雖然沒有人能保證排名的詳細規則,但依據經驗:「關鍵字關聯性」、「著陸頁品質」、「整體網站權重」、「連結與站外資源」,是四大主要因素。

#2-1 關鍵字關聯性

「關鍵字」是搜尋行為的開端,是指用戶在搜尋框輸入的字詞,這個字詞的微小變化,都會直接影響搜尋結果的排名,因為這是唯一判斷使用者意圖的資訊,什麼意思呢?

試想一下,如果有個人在 Google 中搜尋了「冰箱」,請問他正在找甚麼呢?實際上是很難判斷的,因為這個字詞太籠統了,但如果關鍵字變成「冰箱推薦」,就可以猜測出使用者有傾向查看比較各類冰箱的網頁,如果關鍵字變成「冰箱不冷」,那就很明顯是想要找維修相關的網頁。

「關鍵字」是搜尋行為的開端,是指用戶在搜尋框輸入的字詞,這個字詞的微小變化,都會直接影響搜尋結果的排名,因為這是唯一判斷使用者意圖的資訊,什麼意思呢? 試想一下,如果有個人在 Google 中搜尋了「冰箱」,請問他正在找甚麼呢?實際上是很難判斷的,因為這個字詞太籠統了,但如果關鍵字變成「冰箱推薦」,就可以猜測出使用者有傾向查看比較各類冰箱的網頁,如果關鍵字變成「冰箱不冷」,那就很明顯是想要找維修相關的網頁。

理解這些變化非常重要,因為搜尋引擎正是根據關鍵字的意圖變化來調整排名結果。以上述的案例來說,「冰箱」這種意圖模糊關鍵字的搜尋行為,Google 會傾向將排名給予權重最高的網站(通常都會是大型電商或者資訊量超多的網站,例如:PChome、momo⋯⋯)。而遇到「冰箱推薦」這種帶有比較產品意圖的關鍵字,Google 更偏好將排名給予專業部落格、評比網站⋯⋯。

「使用者意圖」與「網站內容」的契合度是影響排名的重要因子,也就是所謂的「關鍵字關聯性」

但在判斷關鍵字關聯性的過程中,有兩個常見的誤解:

  • 關聯性跟密度無關

大家一定要清楚理解,搜尋引擎重視的是內容的「意圖」,而不是網頁上出現了幾次關鍵字。換句話說,只有提供使用者真正想要的解答與觀點,才能取得搜尋引擎的青睞,如果只會盲目地增加關鍵字,一點效果都不會有。我們曾經遇過客戶在撰寫「鑄鐵鍋具如何保養」的文章中,想要硬塞入「鑄鐵鍋推薦」「鑄鐵鍋規格」這類的關鍵字,再次強調,這種作法完全是在浪費時間!

  • 掌握品牌自身的觀點,別只會討好使用者

除了正確理解使用者意圖之外,也請大家要思考企業網站的目標,如果全然屈就於使用者想法,導致文章內容與網站格格不入,即便取得好的排名,也無法引導銷售,無疑是本末倒置。這個想法雖然簡單,卻是專家也常犯的錯誤,不得不特別留意。

因此,正確的做法是理解使用者的意圖,根據這些意圖來結合網站目標來做文章的規劃。關鍵字分析是做好 SEO 的基礎,我們會在後續章節詳細討論。

#2-2 著陸頁品質

第二個影響排名的重要因素是著陸頁的品質(業界多稱為 Landing page),這是指取得關鍵字排名那一個頁面上的品質,也就是使用者搜尋關鍵字後,點擊搜尋結果到的那個頁面。在這個頁面上我們可以簡單分成「內容品質問題」以及「程式架構問題」:

  • 內容長度:並不是寫得越長排名就越好,而是在內容中確實解決使用者問題才會有好成果。但大家觀察會發現排名好的文章幾乎都是長文,原因也很簡單,長文更容易解決多方面的問題,自然會受到青睞;換句話說,解決疑問才是關鍵,長度只是附加物而已。
  • 原創性比例:任何文章多少都會與現有的文章重覆,而重覆的比例是搜尋引擎極度重視的,抄襲更是會傷害網站本質的愚蠢做法。
  • 內容多樣性:這是指文章中是否包含圖片、影片、表格、列表⋯⋯等多種元素,一般來說元素越豐富,內容品質也會越高。但並不是胡亂增加無關圖片與表格,而是根據內容整理出讓使用者更好閱讀的元素才會有用
  • 延伸意圖:文章是否提供了除了使用者疑問之外的延伸問題,例如:「冰箱維修」的文章中除了介紹基本的維修方法之外,也可以增加各地區維修據點查詢、常見的保養方式⋯⋯,依據使用者目前的意圖,做相關延伸是提高品質很有效的方式

以上幾點是針對內容品質問題的主要項目,實際上遠不止這四點,詳細說明我們留到後面專門討論的章節再做展開,接下來簡介「程式架構問題」:

  • title / description 標籤:網頁的標題與基本描述,這兩個都是會直接顯示在搜尋結果上的內容,非常重要又容易優化的 SEO 元素。
  • H 標籤元素:這是所謂的大小標題元素,通常做為段落的區隔,也能夠幫助搜尋引擎理解當前段落的主題,正確的設定對優化有一定幫助。
  • schema 設定:這是專指與搜尋引擎溝通的程式碼,可以向引擎表達當前區塊的意圖,例如:QA、評論、新聞⋯⋯。
著陸頁(業界多稱為 Landing page)的品質是影響排名的重要因素,可以簡單分成「內容品質問題」以及「程式架構問題」,裏面包含 Title、Description、schema 設定、H 標籤等等。

程式相關的優化的細節相當多,後續也將有獨立章節做討論,這裡就不展開了。基本上著陸頁品質就是針對單一個頁面進行的優化,也有人稱之為 On-page 優化,想了解更多可參考這篇文章:On Page SEO 重點整理

#2-3 整體網站權重

再來,那些「不屬於著陸頁,卻影響排名的要素」被歸類在「整體網域權重」,這些項目多是指那些優化後全網站同時受益的項目,常見的有:

  • 網站速度:速度越快使用者越舒服,搜尋引擎自然也更願意給高排名,我們可以簡單用 pagespeed insights速度檢測工具,找出可以優化的方向。
  • 行動裝置易用性:現在的使用者非常重視手機板體驗,以我們經營網站的經驗,手機瀏覽的使用者早已過半,如果網站不支援手機瀏覽,就可能會輸給其他支援手機的網站,行動裝置易用性的整體評估,在 Search Console 當中也有報表可以查閱。
  • SSL 安全協定:近年來 Google 十分重視網頁瀏覽的安全性,尤其是針對需要輸入密碼的網站,設定安全協定是不可避免的優化。
  • 其他設定:sitemap、正確轉址設定、網站架構安排、圖片壓縮問題⋯⋯,都是可以優化的項目。

針對全站權重的項目可以說數不勝數,後續同樣有專門章節說明各項做法,在我們的經驗中,這些項目很少能夠發生單一巨大影響力,概念更像是積沙成塔,藉由一點一點的累積,讓網站整體品質上升。實務經驗上,我們會用根據網站目前的規模與目標,來決定著重的方向

#2-4 連結與站外資源

最後,SEO 領域還有兩大重點:連結站外資源,在操作特性上有一定的相似性,因此被歸納成最後一項關鍵因素。首先說明,所謂的「超連結」是網路通行的道路,在自身網站內的連結稱為「內連」,從其他網站進來的連結稱為「外連」,這兩者對 SEO 的影響極大,內連能夠傳達網站內部頁面重要性的高低,外連則是在整個網路世界的威望

  • 內部連結:最重要的就是內部結構的安排方式,尤其是固定的連結元素,例如:導覽列、側邊攔、頁腳⋯⋯,這些元素會出現在每個頁面上,形成大量的內部連結。除此之外,文章內的引導、最新文章推薦⋯⋯等元素,都是內連的重要設定。
  • 外部連結:大家可以將外部連結想像成「網路投票」,當一個網頁得到越多連結時,就代表得到越多票,自然也會表現的更好。除了數量之外,外部連結還需要注意到網頁的相似性、來源網站的權威性、連結呈現的形式⋯⋯。
  • 站外資源:優化排名並不僅能侷限在自身網站上,其實還有很多可以嘗試的方向,免費的有:各大論壇、工商黃頁社群媒體、討論版、異業合作⋯⋯;付費的有:KOL合作、部落格宣傳、新聞媒體合作⋯⋯,了解其中操作手法與細節,就能從中取得許多好處。

連結策略由於涉及的觀念較為雜亂,算是 SEO 優化中掌握度較低也比較困難的,相關的細節與經驗,後續將有專門章節討論。

#3 結論

了解引擎的運作方式與排名規則後,在實作上還需要考量企業本身的位置,剛起步的網頁與已經成形的知名網站採用的策略完全不同,在 SEO 策略選擇上需要綜合考量不同商業情形

這個章節著重介紹了「搜尋引擎的基本原理」、「解決收錄問題的方法」、「排名規則的分類」。實際上,SEO 優化項目繁多,要找到可以修改的問題一點也不困難,因此,考驗顧問專業性的重點是:「如何用有限的資源取得最好的效果。」

因此,針對商業情形的差異,勢必要做不同的調整:小型網站(1000 頁以內)需要特別重視網站內容,如關鍵字關聯性、著陸頁品質就特別重要。而大型網站由於內容繁多,可以將重心轉到重整體程式的調整,尤其是速度、安全性、外連策略等等。合理的考量企業目前狀況,選擇最合適的優化方針,才能做到事半功倍的效果,後續章節我也將陸續介紹各種優化技巧適合那些情形,相信一定能幫助企業改善 SEO 表現。

有想法嗎?我們很期待與你交流喔~

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

專欄主題

    • 數位轉型 cover
    • 數位轉型 page

    數位轉型知識手冊

    by Procrustes 作者群

    「數位轉型」並不是一個解決方案,而是一種企業經營的思維:「持續性的改善並迭代,最終才能創造高效率、高收益的企業體質!」,Procrustes 收錄各種對數位轉型有幫助的文章,讓你了解數位轉型的執行關鍵。

    • seo-guide-cover
    • seo-guide-page

    SEO 入門指南:全面掌握 SEO 基本知識

    by 賴彤兒(Tony)

    此指南以深入淺出的方式整理所有 SEO 相關知識,並以合理的結構整理,讓你能在短時間內掌握 SEO 龐大的知識體系,是你進入 SEO 領域最好的入門磚。

更多優質文章