重複內容的SEO解決大全

避免 Google 排名殺手,SEO 重複內容的解決大全

重複內容問題的改善在 SEO 當中是舉足輕重的,這可以算是 Google 隱性扣分項目最大的一個,也是評價一個網頁內容水準的關鍵,試想一下,對 Google 來說,如果提供給客戶的內容都是單一互相抄襲的,搜尋用戶肯定不會買單,所以 Google 不斷地強調,想要讓網站有好排名,靠抄襲幾乎不可能,可是你知道嗎?就算正當做網頁內容完全不抄襲,也可能產生很多重複內容!今天的主題,就是要讓你了解如何避免被 Google 針對重複內容議題而懲罰。

什麼是重複內容?

根據 Google 文件的定義,重複內容通常是指一個(或多個)網域中完全(或大致)與其他內容相符的實質內容區塊,其實只要在不同的網址(URL)出現大致相同的內容就可以被稱為重複內容。

一般而言,重複內容本身並不構成欺騙行為,並且常出現在相似產品當中,例如:電商的同款不同色的衣服等等。雖然說 Google 官方文件指出"只要不是刻意的詐欺、欺騙內容,就不會對重複頁面或重複內容進行懲罰",但這種模稜兩可的宣稱,官方並沒有提供任何保證,所以在實務上,盡可能的減少與降低重複內容才是最安全的做法。

補充說明:翻譯內容(Translated Content)雖然是內文的意思跟順序都相同,但只要是不同的語言,就不算是重複內容。所以你會看到有些偷吃步的網站在經營內容時,是透過大量翻譯國外文章做成的,但這種方法雖然在 SEO 上無害,卻有可能觸碰到著作權法,如果你有想要執行類似的策略,需要三思。
補充說明:社群媒體的分享依照定義來說也算是重複內容,但我們不用過度擔心!因為社群媒體並不是我們自己的網站,就算被判定重複內容,也不會傷害到我們網站的 SEO 分數,反而會增加我們的外連,提高網域權重。
網站 SEO 排名殺手,重複內容的解決大全

重複內容的常見種類

很多時候,就算我們沒有想要抄襲,也會因為網頁技術的關係產生大量的重複內容,如果因為這樣而導致 SEO 效果打折,那就太可惜了,請務必留意在這裡提到的各種問題。

網站技術產生的重複內容

以下是品牌網站因為技術沒有合規,而產生的重複內容,這些問題一定要避免:

1. HTTP 與 HTTPS 版本

HTTPS 是讓網站開始用加密傳輸的協定,對於提升網站排名與 SEO 效果都有幫助,不過,如果網站再從 HTTP 轉到 HTTPS 協定時,沒有做好相關的轉址與設定,在網路上就會同時出現兩個版本的網站,也就會被當作重複內容。

2. WWW 與 non-WWW

這個問題與 HTTP、HTTPS 情況類似,也就是網域可以同時經由 www.example.com 或 example.com 進行訪問。而這兩個網址都是呈現相同的內容。

3. 後綴網址

許多使用 .html、.php 或是 .asp 的網站,其主頁通常會是 example.com/index.html 的格式,而你會發現,有時這類型的網站不管是輸入 example.com 或是 example.com/index.html,都可以進入到相同的內容,這是由於在伺服器檔案結構上,這些網址本來就是指向同一個檔案,不過如果沒有固定好網址的規則,就可能被判定為重複內容。

4. 產品變化

最常見的就是電商網站,這類型網站內都有許多的單一商品頁面,但不同型號或配色而產生許多內容大致相同的商品頁(如下圖)。

這些不同規格的產品頁,事實上是同一種產品,只是產品的規格不同,因此除了產品的圖片以及產品名稱之外,其他內容基本會一模一樣,這些都可能被算是重複內容。

產品頁的重複內容

因為行銷行為產生的重複內容

不論是商業合作、自主投稿,當我們到不同網站推廣,或是文章內容被自主分享到其他網站時,網路上就會出現兩個一樣的內容,也會被認為是重複內容!

只不過這種狀況不用太擔心,Google 也知道這種狀況是網路常見的行為,所以會藉由各種要素來判斷原創版本,只要我們有注意到其中的重點,通常都不會影響原創內容的排名,要注意的就是:

  1. 優先發佈於品牌網站:最早發佈的內容屬於原創的機率最高,這是很直觀的,所以如果我們有投稿需求,最好也要先發佈到自己的網站上。
  2. 要求反向連結並註明來源:這是一個網路基本禮儀,所以通常原創版本的反向連結會是最多的,Google 也會以此來判定哪個版本屬於原創,如果可以,最好是要求所有轉載的平台提供反向連結。

重複內容解決方法

並不是所有的重覆性內容都來自抄襲,很多時候網站本身就會出現重覆狀況,這時候利用相對應的程式碼優化,幫助 Google 理解這些內容相互間的關聯性,澄清並非刻意的重覆內容,就能夠改善網站的 SEO 表現了。

利用 canonical 解決

最常見的重複內容出現在產品細節上,很多商品存在顏色、規格、尺寸這類的差異,如果這些差異都產生獨立的網址,容易讓 Google 認為產品網頁之間彼此互相抄襲,可能對SEO產生不好影響。我們可以看到 Google 提供的說明

重複內容問題
  • 為了支援多種裝置類型
  • 為了支援排序或篩選參數或工作階段 ID 等元素而採用動態網址
  • 同一篇文章置於網誌的不同版面底下時,系統會自動儲存多個網址
  • 伺服器經過設定,會針對 www/非 www、http/https 和通訊協定通訊埠變化版本的網址提供相同內容
  • 從你的網誌聯合發布到其他網域中網站的內容,與原始內容相比有部分或完全重複的情況

在現在的搜尋引擎技術不斷提升下,其實很多重複內容的問題已經不會被認定了,但以 SEO 的思維來說,能夠方便 Google 理解網站都是有幫助的,因此,我還是會建議要對重複的狀況做 canonical 標準網址標籤來解決。

Canonical 標記是由 Google 所提出,是 HTML 語法的標記之一,這個標記會幫助 Google 了解網站特定頁面的重複內容,當我們設定好標準網址後,其他重複內容都會被認為是標準網址的不同變化而已,理論上的意涵就是將關鍵字的權重集中到標準網址頁面上。

我們可以在網頁 <head> 的區塊裡增加 <link> 標籤來指出該網頁與其他網頁內容重複。這裡我們舉個例子,當我們要有紅、藍、綠三色同樣款式的洋裝,並且以綠色洋裝作為標準網址 https://example.com/洋裝/綠色洋裝 時,可以依照下列步驟設定:

  1. 綠色洋裝不用加 Canonical 標記!(準確的說是加入沒有幫助,但如果不小心指到別頁就會有壞處。)
  2. 在紅、藍洋裝的商品頁中 <head> 區塊內中新增 <link> 標籤
  3. 設定 rel=”canonical”
  4. 設定 href 再加入標準網址 https://example.com/洋裝/綠色洋裝
<html>
<head>
<link rel="canonical" href="https://example.com/洋裝/綠色洋裝">
</head>
</html>

接著搜尋引擎便會知道這三個頁面之間的關係,三個頁面都是同一種產品,綠色洋裝為標準網址,紅、藍兩色的商品頁為重複內容,並且在 SERP 中只出現綠色洋裝的頁面。設定標準網址還有個好處,就是當紅、藍洋裝也獲得外部連結時,Google 會把權重都放進綠色洋裝中(。

轉址解決

另一個自我重複內容的常見狀況來自新舊網頁的變動、或者網址設定上的程式瑕疵,這個現象與上一小點有本質的差異,在上面多個顏色不同產品的案例中,我們希望解決其不同網址產生的重覆問題,但必須保留這些網址可以造訪的特性,所以僅在網頁的區域增加協助 Google 理解的標籤,對使用者來說是沒有差別的。

但如果我們不僅是要對 Google 宣告,也不需要讓使用者可以看到重複的頁面時,例如:舊網頁、意外產生的網址⋯⋯,就可以用更直接的方式來解決問題,也就是利用轉址來解決。

所謂的轉址是讓到訪者被轉移到另一個網址的做法,程式技術上有非常細節的區分,不過針對 SEO 主題,我們僅需要了解其中的永久性轉址(301)、暫時性轉址(302)、JS 轉址之間的差別就可以了。

  • 永久性轉址(301):如果舊網頁完全不再需要,使用 301 轉址是最好的方法,這個方式將會告知 Google 現在的網址已經「永久」移動到新網頁了。
  • 暫時性轉址(302、JS):特殊的情況下,例如維修、短期公告⋯⋯,某些網頁在短時間內可能不想讓使用者看到,這時候設定暫時性轉址就是正確的做法,這個宣告在時間內不會影響 Google 排名,不過需要注意如果時間太長,還是會被當作永久性的轉址。
轉址說明圖

轉址的設定有很多方法,最直接的方式是從伺服器直接設定,但這需要你的伺服器提供此功能,或者你具有自行編程能力。退而求其次則是在網頁上設定轉址,不過這樣的作法有可能無法正確設定永久性轉址(301),有時候我們也只能妥協的採用如 JS 轉址這類暫時性的做法來解決。

網站內容優化

在消除重複內容的問題時,我們也可能從網站內容部分著手,檢查網站時如果發現有兩個頁面的內容有部分相似,但仍有所不同,可以重新思考這兩個頁面資訊想要呈現的差異性,將這兩個頁面內容做出差異化。

這種方式可以讓網站的整體架構更加清晰,當我們讓每個頁面都有獨特的主題與內容,也能增進使用者體驗,獲得更好的 SEO 效果。

另外,當我們努力將網站中大量相似的內容整合成為單一篇文章,除了能夠降低重複性,還能讓單篇文章的內容篇幅更長,所觸及的深度更廣,大大提升單篇文章的品質,提供使用者真正想看的資訊,增加使用者體驗才是最優解。

如何檢查是否有重複內容?

很多時候其實我們並不知道自己的品牌網站是不是有重複內容問題,這邊提供幾個快速檢查的方法,讓你能夠自我檢測。

Search Console

在【體驗】區段的『網頁體驗』裡,可以看到非 HTTPS 網址HTTPS 網址的頁面數量,再交叉比對找出是否有重複頁面。

在【成效】區段的『搜尋結果』裡,我們可以比對使用同一個關鍵字進入網站的到達頁面清單,比對是否有內容大致相同的網頁是同個關鍵字的到達頁面。

Google Analytics

可以從【行為】→【網站內容】→【所有網頁】看到網站被 Google 收錄的所有頁面,我們先篩選出流量較低的頁面,再檢查是有否可以從不同版本的網址進入同個頁面,這個方法雖然可以確實檢測出重複內容,但是需要耗費許多時間。

Google 搜尋指令 site

在自有網站域名前加site:,網址的最後面再加上關鍵字,查看是否有相同或相似的內容出現在多個頁面上。

其他付費工具(如Screaming Frog、Ahrefs、Semrush 等)

上面提到的三種方式都是透過 Google 已收錄以及有流量的網頁做檢測,但這不代表網站內沒有重複內容,這時我們就可以使用外部的付費工具對網站進行全面的內容和架構分析,以判斷是否存在重複內容問題。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

返回頂端