了解SEO的用途與目標後,我們正式進入SEO領域的基礎,這個章節會介紹SEO最核心的知識:搜尋引擎原理、排名核心原則,藉此建構搜尋引擎優化的基礎知識。需要先說明的是,這個章節將會圍繞在「觀念」的闡述上,針對各種實作經驗,在後續章節才會完整說明,其中將會大量用到本章的基礎知識,請務必在這個章節打好相關基礎。
搜尋引擎與排名規則QA總結
對使用者來說,搜尋引擎是從「輸入關鍵字」開始的,輸入關鍵字以後,搜尋引擎將會針對關鍵字性質,從其資料庫進行排名比序,最後回傳排名的結果給使用者(SERP)。
這個過程被稱為「索引」,一般來說,甚麼都不做google也會通過各種連結找到你的網站,將其納入資料庫中。但如果網站規模太小或者想要加快這個過程,就可以直接到各個搜尋引擎提供的網站管理中心,進行網址與Sitemap目錄提交。
這是一個業界謎題,因為搜尋引擎從來沒有完整公開演算法過,但根據我的經驗來說,總共有四大重點:關鍵字關聯性、著陸頁品質、整體網站權重、連結與站外資源。解決這幾大問題,通常就能取得好的排名。
「搜尋」是現代人絕不陌生的行為,遇到事情先問Google,是許多數人的習慣。而搜尋這件事,也正是SEO的開端:從使用者在搜尋引擎中輸入關鍵字開始,google將會根據演算法從資料庫中決定各網站排名,最後回傳搜尋結果頁(SERP)給使用者。SEO所做的目標,就是想要在第二步驟中,盡可能從演算法中取得高分,以取得更高的排名。
解決索引問題,才可能取得排名
想獲得排名,最基本的要求必須讓網站儲於引擎的資料庫當中,這個過程涉及兩個問題「檢索」與「索引」:

搜尋引擎會經由「檢索」的過程,找出網路上的檔案,並進行「索引」將其規納入自身的資料庫當中。
- 檢索(爬取):檢索是指搜尋引擎利用頁面中的連結,在網頁間一個一個走過,逐漸了解整個網站內容的過程,由於這個過程就像是在爬行一樣,因此被業界稱為「爬取」。在這個過程中,搜尋引擎將會確認網站中有多少頁面、程式碼、文字、圖檔……等等,是認識網站的第一步驟。
- 索引(收錄):搜尋引擎爬取完網站之後,「通常」會將其放入引擎資料庫中,以供後續進行排名使用,這個過程稱為索引(收錄)。我們可以輕易地利用各大搜尋引擎的網站管理系統來查看收錄狀況,以google來說,就是Search Console,其中的涵蓋範圍就能清楚看出索引狀況。
大家必須知道的是,如果網站沒有被索引,就等於不存在搜尋引擎的資料庫當中,也將不可能有排名,因此解決索引問題往往是SEO優化的第一課題,這裡我將會總結經驗,針對索引問題說明並告訴大家如何解決:
#1 引擎不是萬事通,有可能不知道你有網站了:
大多數網站沒有被索引都源於這個問題,慶幸的是非常容易解決,我們只要主動告訴搜尋引擎網站在哪,就能改善這個問題。以Google來說,申請Google Search Console,針對個別網頁提交索引需求,或者直接進行Sitemap提交,就能解決問題。(Sitemap是指你的網站目錄,如果你沒有這個目錄,可以用Sitemap產生工具簡單生成,並在SC提交。額外補充,Sitemap產生器網路上有很多,如果是用WP等內容管理器架設的網站,也有很多外掛可以生成,這個檔案的精緻對對優化影響極小,只要能夠提交就好,用什麼工具都可以。)

Google Search Console是一個很實用的網站管理工具,除了能夠提交網址與Sitemap,也包含查看排名統計、各項優化數據資料,未來我將會專門寫一篇Search console的應用文章。
如果網站規模不大,並且內部連結設計合理,提不提交Sitemap影響不大,大可以只提交幾個網站的重要頁面:首頁、文章分類頁、產品分類頁,其他的就讓Google自行爬取就好,對Google而言,提交Sitemap僅僅是加快一點爬取的速度而已,並非必要性的。
另外,大多數的網站其實沒有做宣告與提交也會被Google找到,這是因為Google本身就會嘗試尋找有人觀看、分享、與存有外連的網站,因此,「提交」這個行為,更像是給剛起步的小網站快速通知Google使用的。
#2 無法爬取正確內容:
上面我們提過搜尋引擎在索引之前,會進行爬取的動作,但並不是每個網站都適合爬取,如果網站本身採用的技術不適合,可能會導致Google機器人無法取得完整資訊,最典型的例子就是以ajax寫成的瀑布流內容(也就是頁面在網址不變動的過程中,不斷產生新內容的做法,Facebook就是典型的代表),這種程式寫法對「爬取」過程相當不友善。
因此,在SEO實務上,大多會建議避免在重要內容中使用JavaScript、ajax、flash……等技術,尤其要避免用在:導覽列、麵包屑、產品目錄、文章列表……等連結元素。雖然近年來Google不斷強化其爬取能力,對於多數JavaScript生成的內容也可以抓取了,但我始終認為多一事不如少一事,可以用更好的方法解決時,沒有必要徒增自己的煩惱。
我們可以利用Search Console來檢查是否出現這個問題,直接進入Search Console進行網址檢查線上測試網址,就可以看到在Google眼中網站長甚麼樣子,最關鍵的是檢查網站核心內容,是否出現在Google看到的代碼中。

利用Search Console檢查網頁的好處是,能夠順便提交網頁,並且查看除了內容呈現之外的更多資訊。
我通常建議用Search Console來做檢查,因為你可以在檢查的同時順便進行提交等作業。但如果要快速查詢時,我也會利用搜尋結果頁上的「頁庫存檔」功能,這是指Google對網頁進行的快取,它能在某種程度上反應Google如何看待這個網頁,找到網頁後選擇文字版,通常只要這裡呈現出主要內容,就表示Google對於爬取網站沒有太多困難。

使用頁庫存檔頁面最大的好處就是快,不用等Search Console慢慢跑,但這個頁面必須要在網站有被索引才可以查看,更多是用在檢查頁面中的重要內容,是否能夠被Google看到,對於有使用JavaScript技術的網站來說,是重要的檢查項目。
#3 內容沒有價值或重覆性太高:
當網頁太過單薄,或者內容重覆性太高時,Google可能會認為是垃圾網頁而不索引,遇到這種問題,該考慮的不是索引狀況,而是檢視自己網站中為什麼會有這種內容不足、重覆性高的頁面,調整這些問題,才是解決的根本之道。
補充一點,如果Google因為內容重覆性過高而不索引網頁,其實並非壞事,因為重覆性內容將會造成網站整體權重下降,進而影響排名。在實際操作SEO的過程中,排除被索引的重覆頁面就是會使用的SEO手法。
#4 網站經營者自行設定的宣告:
有些程式標籤能夠拒絕Google索引網頁,這些標籤通常用在不想被搜尋到的網頁上,例如:我的帳戶、結帳頁、或者是還未開發完成的頁面……等等。大多數情況這都是經營者自己設定的,但確實有開發商忘記刪除這些標籤,導致客戶在上線後的3個月完全沒有被索引的窘境,因此,檢查是否有錯誤的標籤也是相當重要的。
在這裡,我們進階說明一下,如果我們連讓Google爬取都不希望的時候,可以在網站跟目錄添加一個robots.txt的檔案,並對其宣告那些頁面不允許爬取,以下是程式寫法範例:
- User-agent:填入搜尋引擎的值(* 號代表全部、Googlebot代表Google、bingbot代表Bing,其他搜尋引擎也有自己的代碼。)
- Disallow:填入不希望被搜尋引擎檢索的頁面路徑(/代表所有網頁,也可以個別輸入單一路徑下的全部頁面,例如:/admin/ 就會拒絕這個路徑下的網頁。)
- Allow:允許爬取的網頁路徑,由於預設就是所有網頁,因此通常不用設定。
讓我們看幾個範例:
//範例一:阻止所有搜尋引擎檢索所有頁面
User-agent: *
Disallow: /
//範例二:只阻止google引擎檢索所有頁面
User-agent: Googlebot
Disallow: /
//範例三:阻止所有引擎檢索 /admin/ 路徑下的全部頁面
User-agent: *
Disallow: /admin/
一般來說,工程師會在開發階段阻止所有引擎檢索所有頁面,在開發完成後通常只會禁止敏感資訊的頁面,例如:登入頁、購物車、個資相關頁面……等等。
除了利用robots.txt檔案之外,也可以在該頁面宣告不希望被納入資料庫的程式碼,但不同的是,在頁面上的宣告是禁止納入資料庫,引擎還是會爬到這個網頁。最常使用的情況是希望引擎拿這個網頁當作跳板,但不要被搜尋到。
要做到這些事情,需要搭配兩個指令一起使用,分別是:noindex標籤與nofollow標籤,index是宣告要不要被索引,follow則是宣告頁面上的連結要不要爬取。

在網頁
區域的標籤設定:meta name=”robots” content=”noindex, nofollow” 就能夠拒絕引擎的存取與繼續爬取這兩個指令搭配使用所產生的宣告邏輯如下:
// 範例一:沒有意義,因為預設值就是這個,所以這樣宣告等於沒有宣告
< meta name="robots" content="index, follow">
// 範例二:這是告訴引擎,不要索引這個頁面,同時這個頁面下的連結也不要再繼續爬了。
< meta name="robots" content="noindex, nofollow">
// 範例三:檢索資料時該頁面的相關連結不要檢索。
< meta name="robots" content="index, nofollow">
// 範例四:這是最常使用的,就是不要索引這個頁面,但頁面上的連結可以繼續爬,也就是把這個頁面當作跳板就好。
< meta name="robots" content="noindex, follow">
不過其實大多數在實作上沒有區分的這麼仔細,只會進行簡單的檢查,看看是不是有人為疏忽的狀況發生。
排名順序的潛規則
「為甚麼網站是這個排名?」這是所有學習SEO的人都應該有的疑問,但坦白說,沒有任何人敢說自己知道答案,因為Google本身也從未公開排名完整的演算法,最多只是告訴大家某些因素有影響,但影響力、重要性則從來沒有確認,這始終是個業界之謎。
在這樣的條件下,任何人提出的看法都不會是標準答案,我也不例外。以下內容是我長年學習與操作後的總結,如果大家看其他文章發現介紹方式與重視環節與我不同,千萬不用奇怪,因為SEO領域的專家本來就應該有一套自己想法與經驗,你需要思考的是:這些觀點是否對你的網站有幫助?

雖然沒有人能保證排名的詳細規則,但依據我的經驗:關鍵字關聯性、著陸頁品質、整體網站權重、連結與站外資源,是四大主要因素。
在我的經驗中,排名重點要分成「關鍵字關聯性」、「著陸頁品質」、「整體網站權重」、「連結與站外資源」這四大重點,每個項目底下還有無數可以優化的細節:
#1 關鍵字關聯性
「關鍵字」是搜尋行為的開端,指用戶在搜尋框輸入的字詞,這個字詞的微小變化,都會直接影響搜尋結果的排名,因為這是唯一判斷使用者意圖的資訊,什麼意思呢?
試想一下,如果有個人在google中搜尋了「冰箱」,請問他正在找甚麼呢?實際上是很難判斷的,因為這個字詞太籠統了,但如果關鍵字變成「冰箱推薦」,就可以猜測出使用者有傾向查看比較各類冰箱的網頁,如果關鍵字變成「冰箱不冷」,那就很明顯是想要找維修相關的網頁。
理解這些變化非常重要,因為搜尋引擎正是根據關鍵字的意圖變化來調整排名結果。以上述的案例來說,「冰箱」這種意圖模糊關鍵字的搜尋行為,Google會傾向將排名給予權重最高的網站(通常都會是大型電商或者資訊量超多的網站,例如:pchome、momo……等等)。而遇到「冰箱推薦」這種帶有比較產品意圖的關鍵字,Google更偏好將排名給予專業部落格、評比網站……等等。
「使用者意圖」與「網站內容」的契合度是影響排名的重要因子,也就是所謂的「關鍵字關聯性」。
但在判斷關鍵字關聯性的過程中,有兩個常見的誤解:
#A 「關聯性」跟「密度」無關:
大家一定要清楚理解,搜尋引擎重視的是內容的「意圖」,而不是網頁上出現了幾次關鍵字。換句話說,只有提供使用者真正想要的解答與觀點,才能取得搜尋引擎的青睞,如果只會盲目地增加關鍵字,一點效果都不會有。我就曾經遇過客戶在撰寫「鑄鐵鍋具如何保養」的文章中,想要硬塞入「鑄鐵鍋推薦」「鑄鐵鍋規格」這類的關鍵字,再次強調,這種作法完全是在浪費時間!
#B 掌握品牌自身的觀點,別只會討好使用者:
除了正確理解使用者意圖之外,也請大家要思考企業網站的目標,如果全然屈就於使用者想法,導致文章內容與網站格格不入,即便取得好的排名,也無法引導銷售,無疑是本末倒置。這個想法雖然簡單,卻是連我也常常犯的錯誤,不得不特別留意。我就曾經為了追求酒類相關的關鍵字,硬是寫了諸多品牌介紹的文章,網站流量確實有起色,但由於這些品牌都不是主力商品,所以實際產生的商業幫助其實很低,典型的叫好不叫座……
因此,正確的做法是理解使用者的意圖,根據這些意圖來結合網站目標來做文章的規劃。

長尾關鍵字是指搜尋量特別低的關鍵字群,雖然單一關鍵字搜尋量很低,但累積起來卻會形成網站很大的流量來源,除此之外,長尾關鍵字有意圖明確、競爭容易的好處。合理的做法並不是針對長尾關鍵字做文章,而是觀察長尾的現象,藉以安排合理網站架構。圖表資料來源:What Are Long-tail Keywords? How to Find and Use Them
另一個值得關注的重點是,根據意圖的區隔細緻程度,理所當然會直接影響搜尋數量,例如:搜尋「冰箱」的人一定遠多過「冰箱維修」,意圖越明確,搜尋量就越低,當低過某個門檻時,業界稱這些關鍵字為「長尾關鍵字」。
長尾關鍵字有著競爭度低、意圖明顯的優點,乍看之下好像特別值得做,但別忘記了,長尾關鍵字的基本定義就是搜尋量極低,針對這些關鍵字做文章,是收益低微的作法。
說到這些我不得不提業界的慣用伎倆:欺騙客戶以長尾關鍵字做為績效評估的指標,也就是把這些本來就超級容易取得排名的關鍵字,當作是優化的主力,並且用其有明顯意圖的優點來洗腦客戶,許多人不明所以就會當真,真實的狀況是,他沒有能力優化正常的關鍵字,只能在簽約時就做手腳,讓客戶把專注力放在長尾關鍵字上,到時候隨便做也會有排名,即便沒有商業效果也能撇清責任,是非常沒有道德的作法,卻是業界最常用的伎倆。
其實長尾關鍵字根本不應該操作,這些關鍵字是在優化一般關鍵字就會自然取得排名的附屬物,只要我們合理的規劃網站架構,產出符合使用者意圖的內容,根本不用留意長尾關鍵字的發展,即便想要優化這類字群,也是在其他主力關鍵字都完成以後,絕不是一開始就鎖定錯誤的目標!
#2 著陸頁品質
第二個影響排名的重要因素是著陸頁的品質(業界多稱為landing page),這是指取得關鍵字排名那一個頁面上的品質,也就是使用者搜尋關鍵字後,點擊搜尋結果到的那個頁面。在這個頁面上我們可以簡單分成「內容品質問題」以及「程式架構問題」:
- 內容長度:並不是寫得越長排名就越好,而是在內容中確實解決使用者問題才會有好成果。但大家觀察會發現排名好的文章幾乎都是長文,原因也很簡單,長文更容易解決多方面的問題,自然會受到青睞,換句話說,解決疑問才是關鍵,長度只是附加物而已。
- 原創性比例:任何文章多少都會與現有的文章重覆,而重覆的比例是搜尋引擎極度重視的,抄襲更是會傷害網站本質的愚蠢做法。
- 內容多樣性:這是指文章中是否包含圖片、影片、表格、列表……等等多種元素,一般來說元素越豐富,內容品質也會越高。但並不是胡亂增加無關圖片與表格,而是根據內容整理出讓使用者更好閱讀的元素才會有用。
- 延伸意圖:文章是否提供了除了使用者疑問之外的延伸問題,例如:「冰箱維修」的文章中除了介紹基本的維修方法之外,也可以增加各地區維修據點查詢、常見的保養方式……等等,依據使用者目前的意圖,做相關延伸是提高品質很有效的方式。
以上幾點是針對內容品質問題的主要項目,實際上遠不止這四點,詳細說明我們留到後面專門討論內容的章節再做展開,接下來簡介「程式架構問題」:
- title / description標籤:網頁的標題與基本描述,這兩個都是會直接顯示在搜尋結果上的內容,非常重要又容易優化的SEO元素。
- H標籤元素:這是所謂的大小標題元素,通常做為段落的區隔,也能夠幫助搜尋引擎理解當前段落的主題,正確的設定對優化有一定幫助。
- schema設定:這是專指與搜尋引擎溝通的程式碼,可以向引擎表達當前區塊的意圖,例如:QA、評論、新聞……等等。
程式相關的優化的細節相當多,會是我們下一個章節的主題,這裡就不展開了。基本上著陸頁品質就是針對單一個頁面進行的優化,大多數的調整也都只需要在這個頁面上就可以完成,對當頁的關鍵字排名幫助很大。
#3 整體網站權重
再來,那些「不屬於著陸頁,卻影響排名的要素」被我歸類在「整體網域權重」,這些項目多是指那些優化後全網站同時受益的項目,常見的有:
- 網站速度:速度越快使用者越喜歡,搜尋引擎自然也更願意給高排名,我們可以簡單用pagespeed insights速度檢測工具,找出可以優化的方向。
- 行動裝置易用性:現在的使用者非常重視手機板體驗,以我經營的多個網站綜合評估,手機瀏覽的使用者早已過半,如果網站不支援手機瀏覽,就可能會輸給其他支援手機的網站,行動裝置易用性的整體評估,在Search Console當中也有報表可以查閱。
- SSL安全協定:近年來Google十分重視網頁瀏覽的安全性,尤其是針對需要輸入密碼的網站,設定安全協定是不可避免的優化。
- 其他設定:sitemap、正確轉址設定、網站架構安排、圖片壓縮問題……等等,都是可以優化的項目。
針對全站權重的項目可以說數不勝數,同樣會在後續章節詳細說明,但在我的經驗中,這些項目很少能夠發生單一巨大影響力,其概念更像是聚沙成塔,藉由一點一點的累積,讓網站整體品質上升。實務經驗上,我會用根據網站目前的規模與目標,來決定著重的方向。
#4 連結與站外資源
最後,SEO領域還有兩大重點:連結與站外資源,在操作特性上有一定的相似性,因此被我歸納成最後一項關鍵因素。首先說明,所謂的「超連結」是網路通行的道路,在自身網站內的連結稱為「內連」,從其他網站進來或者出去到別人網站的連結稱為「外連」,這兩者對SEO的影響極大,內連能夠傳達網站內部頁面重要性的高低,外連則是在整個網路世界的威望。
- 內部連結:最重要的就是內部結構的安排方式,尤其是固定的連結元素,例如:導覽列、側邊攔、頁腳……等等,這些元素會出現在每個頁面上,形成大量的內部連結。除此之外,文章內的引導、最新文章推薦……等等元素,都是內連的重要設定。
- 外部連結:大家可以將外部連結想像成「網路投票」,當一個網頁得到越多連結時,就代表得到越多票,自然也會表現的更好。除了數量之外,外部連結還需要注意到網頁的相似性、來源網站的權威性、連結呈現的形式……等等。
- 站外資源:優化排名並不僅能侷限在自身網站上,其實還有很多可以嘗試的方向,免費的有:各大論壇、工商黃頁、社群媒體、討論版、異業合作……等等;付費的有:KOL合作、部落格宣傳、新聞媒體合作……等等,了解其中操作手法與細節,就能從中取得許多好處。
連結策略由於涉及的觀念較為雜亂,算是SEO優化中比較困難的,也需要發揮創意與想像力,才容易從中突破,相關的細節與經驗,就讓我們在專門討論的章節詳細說明。
#Procrustes 結論

了解引擎的運作方式與排名規則後,在實作上還需要考量企業本身的位置,剛起步的網頁與已經成形的知名網站採用的策略完全不同,在SEO策略選擇上需要綜合考量不同商業情形。
這個章節著重介紹了「搜尋引擎的基本原理」、「解決收錄問題的方法」、「排名規則的分類」。實際上,SEO優化項目繁多,要找到可以修改的問題一點也不困難,因此,考驗顧問專業性的重點是:「如何用有限的資源取得最好的效果。」
因此,針對商業情形的差異,勢必要做不同的調整:小型網站(1000頁以內)需要特別重視網站內容,如關鍵字關聯性、著陸頁品質就特別重要。而大型網站由於內容繁多,可以將重心轉到重整體程式的調整,尤其是速度、安全性、外連策略……等等。合理的考量企業目前狀況,選擇最合適的優化方針,才能做到事半功倍的效果,後續章節我也將陸續介紹各種優化技巧適合那些情形,相信一定能幫助企業改善SEO表現。
接下來會進入SEO實作相關的技巧與經驗,下一篇《SEO入門指南(三):與程式碼相關的SEO調整》就會完整介紹所有程式面向的SEO優化技巧,其中包含單頁面優化技巧、全站程式注意事項,絕對可以從中找到網站的不足,進而優化改善排名!
章節主題 | 章節摘要 | 連結 |
---|---|---|
第一章: SEO用途侷限&基本觀念 | 了解SEO的能耐與限制,幫助企業判斷是否需要這個技術;同時也幫助想學習SEO的新手,給予正確的SEO學習觀念。 | https://procrustes.info/seo-guide-part1/ |
第二章: 搜尋引擎基礎&排名潛規則 | 介紹搜尋引擎原理,針對收錄問題、排名原因進行觀念上的說明,唯有了解基礎觀念才能實踐後續的操作章節。 | https://procrustes.info/seo-guide-part2/ |
第三章: 關鍵字規劃&內容優化實作 | 關鍵字規劃是SEO的根基,許多策略是從這個概念所展開,這個章節前半段將著墨於此;後半段,則將與SEO相關的內容優化方式一併討論。(近期公布) | |
第四章: 程式碼優化細節 | 本章節討論那些與SEO程式碼相關的問題,將分為:單一頁面元素細節、全站架構優化,用來改善網站體質相當有效,也是SEO領域不可或缺的知識。(近期公布) | |
第五章: 頁面關聯性與連結策略 | 這個章節討論SEO領域特有的知識點:「連結」,也藉由這個概念提出頁面關聯性的問題,屬於進階的知識與優化技巧。(近期公布) | |
第六章: 各種工具、數據分析、優化迴圈 | 這個章節補中SEO領域的細節,討論各種常用的工具,說明如何用數據驅動優化流程,並總結我的多年經驗提供給大家參考。(近期公布) | |
附錄一: SEO檢核表(SEO table) | 完整的SEO檢查清單,蒐錄所有我認為對SEO有改善的細節,需要有足夠的知識才適合閱讀。(近期公布) |
分享看法