Thẻ canonical: hợp nhất các URLs có nội dung trùng lặp

Canonical Là Gì? Hợp Nhất URL Hạn Chế Trùng Lặp Nội Dung SEO

Sự cố nội dung trùng lặp trong SEO thường xảy ra khi có nhiều URL khác nhau cùng hiển thị nội dung giống hoặc gần giống nhau, nếu bạn không dùng thẻ Canonical để chỉ ra URL của trang chính cho Bot tìm kiếm, Bot sẽ tự động chọn một trong các URL trùng lặp làm URL Canonical để thu thập dữ liệu, lập chỉ mục và xếp hạng nội dung.

Vì vậy trong bài viết này, UptopZ Media sẽ giúp bạn biết cách dùng rel=”canonical” trong SEO để hợp nhất URL trùng lặp, cải thiện tốc độ cào của Bot và tăng thứ hạng trang trên kết quả tìm kiếm. Hãy cùng bắt đầu đi vào chi tiết!

Canonical là gì?

Thẻ liên kết chính thức rel=“canonical” (hay còn gọi thẻ Canonical, thẻ chuẩn hoặc thẻ hợp quy) là một phần tử liên kết HTML được dùng để chỉ ra bản chính của một trang. Sáng kiến này do Google, Microsoft và Yahoo đã kết hợp với nhau để tạo ra vào năm 2009, nhằm mục đích ngăn chặn nội dung trùng lặp xuất hiện trên nhiều URL khác nhau trên Internet. Nó được mô tả cụ thể trong tài liệu RFC 6596, chính thức phát hành trực tuyến vào tháng 4 năm 2012.

Cấu trúc thẻ canonical đơn giản nhất :

<link rel=”canonical” href=“https://example.com/sample-page/” />

Trong đó, ý nghĩa của từng thành phần được biểu đạt như sau:

  • link rel=“canonical”: Liên kết trong thẻ này là bản chính của trang này.
  • href=“https://example.com/sample-page/”: xem bản chính tại đây.
Minh họa cách thức hoạt động của thẻ Rel="canonical" hoạt động trong SEO, khi chỉ định trang A là trang chính tắc trong tập hợp trang trùng lặp trên trang web Uptopz.com lần lượt gồm Trang A, Trang B, Trang C.
Minh họa cách thức hoạt động của thẻ Rel=”canonical” hoạt động trong SEO, khi chỉ định trang A là trang chính tắc trong tập hợp trang trùng lặp trên trang web Uptopz.com lần lượt gồm Trang A, Trang B, Trang C.

Tại sao Canonical URL lại quan trọng đối với SEO?

Mọi người thường có xu hướng xem những trang giống nhau hoặc tương tự nhau là một. Nhưng đối với Bot thì không, chúng xem mỗi URL khác nhau là đại diện cho những trang riêng rẻ, ngay cả khi các trang đó được tạo ra để phục vụ cho một mục đích chung.

Mặc dù, có nhiều lý do chính đáng để tạo ra nhiều URL trùng lặp trên website của bạn. Nhưng bạn không thể giải thích cho Bot hiểu được từng lý do như cách bạn sẽ nói chuyện với một người bạn ở bên ngoài. Vì vậy, nếu không chỉ định URL Canonical cho bot, sẽ khiến nó tiêu hao rất tài nguyên và thời gian cho việc thu thập dữ liệu trên các URL trùng lặp để chọn ra URL phù hợp. Quan trọng hơn hết, là rất có thể URL Canonical mà Bot chọn không phải là URL mà bạn mong muốn xếp hạng. Những điều này sẽ làm phá vỡ hoàn toàn các kế hoạch mà bạn vạch ra và tệ hơn là chúng làm giảm thứ hạng SEO của bạn đáng kể.

Chú thích

Canonical URL (hay URL chính tắc) được xem là đại diện tốt nhất của nhóm trang trùng lặp, nó được ưu tiên hiển thị trên kết quả tìm kiếm và được bot thu thập dữ liệu thường xuyên hơn.

Bên dưới là những lợi ích mà bạn có thể nhận được khi sử dụng thẻ Canonical:

  • Giúp chỉ định trang mà bạn muốn mọi người nhìn thấy trên kết quả tìm kiếm

Nếu trang có nhiều phiên bản hỗ trợ xem trên nhiều thiết bị khác nhau, một bài viết trên Blog được đặt trong nhiều mục hay trang được thiết lập URL động cho tham số tìm kiếm, mã nhận dạng ID phiên,… Nhưng bạn chỉ muốn khách truy cập vào trang từ một URL duy nhất khi họ thực hiện các truy vấn trên các công cụ tìm kiếm thì bạn có thể chỉ định URL cần xuất hiện trên SERP bằng thẻ hợp quy rel=canonical.

  • Tăng khả năng xếp hạng trang web

Chúng tôi đang nói đến Pagerank – Thuật toán đánh giá xếp hạng trang dựa vào số lượng và chất lượng các liên kết trỏ đến một trang. Việc trang web sinh ra quá nhiều URL không cần thiết sẽ làm giảm mức độ phổ biến liên kết trên trang của bạn.

Hơn nữa, khi quy mô trùng lặp nội dung trở nên lớn hơn trên trang web, nó sẽ khiến các công cụ tìm kiếm gặp khó khăn trong việc xác định đúng URL mà bạn cần xếp hạng cho nội dung của mình, tình trạng các trang của bạn tự cạnh tranh thứ hạng lẫn nhau (hay còn gọi là “Ăn thịt từ khóa”) là điều khó có thể tránh khỏi.

Vì lẽ đó, thêm thẻ Canonical cho các trang sẽ giúp công cụ tìm kiếm hợp nhất những thông tin thu thập được thông qua từng URL riêng lẻ bao gồm cả các liên kết trỏ đến trang đó.

  • Tiết kiệm hạn mức thu thập dữ liệu

Các công cụ tìm kiếm giới hạn tài nguyên, thời gian và tần suất truy cập của Bot trên mỗi website để có thể thu thập được nhiều thông tin và nhanh nhất trên Internet. Thẻ Canonical giúp tối ưu hạn mức thu thập dữ liệu hỗ trợ Bot nhanh chóng phát hiện thêm trang mới, dễ dàng xếp hạng những nội dung “ấn tượng” đang nằm sâu bên trong trang web của bạn bằng cách bỏ qua các URL trùng lặp.

  • Cải thiện khả năng quản lý nội dung tổng hợp

Thẻ Canonical cực kỳ hữu ý cho việc quản lý nội dung được xuất bản trên nhiều miền. Nó cho phép bạn chỉ định cho các công cụ tìm kiếm biết đâu là nguồn chính thức. Tuy nhiên, nó không phải là một “chỉ thị bắt buộc”, nó chỉ là “gợi ý” vì thế không có gì đảm bảo các công cụ tìm kiếm sẽ lập chỉ mục cho trang mà bạn muốn chọn làm URL chính tắc.

Thêm canonical trong trường hợp này có thể giúp bạn quản lý nội dung tốt hơn, tránh nguy cơ bị phạt, tránh tình trạng nội dung và giảm thiểu nguy cơ công cụ tìm kiếm chọn một phiên bản không mong muốn thành trang chính.

Chú thích

Vấn đề trùng lặp không chỉ xảy ra với những trang giống hệt nhau, đối với những trang có thay đổi nhỏ nhưng không đáng kể thì bản thân chúng cũng không được Bot tìm kiếm đánh giá là một trang độc lập.

Khi nào nên sử dụng thẻ Canonical?

Bất kỳ khi nào bạn tạo ra thêm nội dung giống nhau hoặc tương tự nhau trên web thì hãy sử dụng rel=”canonical” để để chỉ định trang gốc cho Bot tìm kiếm. Điều này bao gồm cả lý do chính đáng và không chính đáng như:

Để hỗ trợ nhiều loại thiết bị:

  • https://example.com/toa-nha/vincom
  • https://m.example.com/toa-nha/vincom
  • https://amp.example.com/toa-nha/vincom

Để dùng URL động cho tham số tìm kiếm, mã nhận dạng của phiên hoạt động, v.v..:

  • https://www.example.com/seo/canonical?utm_source=google&utm_medium=cpc&utm_campaign=pto&utm_id=E1231
  • https://www.example.com/?s=canonical
  • https://www.example.com/seo/canonical

Hệ thống Blog tự động lưu nhiều URL khi bạn đặt một bài đăng trong nhiều mục.

  • https://example.com/quang-cao/google-adwords.html
  • https://example.com/marketing/google-adwords.html

Nội dung được phân phối trên nhiều biến thể (cổng giao thức http/https, www. hoặc không có www.)

  • http://example.com/quang-cao/google-adwords
  • http://www.example.com/quang-cao/google-adwords
  • https://example.com/quang-cao/google-adwords
  • https://www.example.com/quang-cao/google-adwords

Nội dung được phân phối trên nhiều miền khác nhau:

  • https://example.com/seo/canonical-la-gi
  • https://seo.example.com/canonical-la-gi

Quy tắc cơ bản khi sử dụng thẻ Canonical

Để chỉ định Canonical URL cho trang, thì bạn chỉ cần thay thế URL trong công thức <link rel=”canonical” href=”https://example.com/” /> bằng URL của bạn và đặt tất cả chúng vào phần <head> trên trang web.

Chú thích

  • Nếu URL được khai báo Canonical trên một trang là chính nó. Điều đó có nghĩa trang đó là bản chính (trang chuẩn).
  • Nếu URL được khai báo Canonical là một trang khác. Điều đó có nghĩa trang đó là bản sao của một trang khác.

Thêm thẻ Canonical không khó, những bạn cần nắm rõ 5 quy tắc để áp dụng bất kỳ phương pháp nào cũng đem lại hiệu quả cao:

5 nguyên tắc sử dụng thẻ Rel="canonical" trong SEO để chỉ định URL chính tắc cho công cụ tìm kiếm.
5 nguyên tắc sử dụng thẻ Rel=”canonical” trong SEO.

Quy tắc số 1 – Sử dụng URL tuyệt đối

Với tư cách là Search Advocate của Google – John Mueller đã chia sẻ rằng cách tốt nhất là không nên sử dụng các đường dẫn tương đối với các phần tử liên kết rel=“canonical”.

Vì thế, bạn nên sử dụng cấu trúc sau:

<link rel = “canonical” href = “ https://example.com/sample-page/ ” />

Trái ngược với cấu trúc:

<link rel = “canonical” href = ” / sample-page / ” />

Quy tắc số 2 – Sử dụng URL viết thường, không dấu

Công cụ tìm kiếm coi các URL viết hoa và viết thường (hoặc có dấu và không dấu) là các URL khác nhau. Khi sử dụng thẻ rel=”canonical”, bạn nên sử dụng chữ viết thường, không dấu cho URL của mình nhằm tạo ra tính nhất quán. Việc sử dụng chữ thường rất quan trọng vì chúng đảm bảo lập chỉ mục đúng URL trên trang web của bạn.

Quy tắc số 3 – Sử dụng đúng phiên bản miền (HTTPS so với HTTP)

Việc trao đổi các thẻ Canonical HTTP và HTTPS của chúng sẽ dễ gây nhầm lẫn cho bot của công cụ tìm kiếm. Google khuyên bạn nên ưu tiên sử dụng trang HTTPS hơn trang HTTP, trừ một số trường hợp trang HTTPS có chứng chỉ SSL không hợp lệ, chứa yếu tố phụ thuộc không an toàn (ngoài hình ảnh), chuyển hướng người dùng đến HTTP.

Nếu trang web của bạn đã chuyển sang Lớp cổng bảo mật SSL hoặc HTTPS thì tuyệt đối không khai báo bất kỳ URL nào không phải SSL (tức là HTTP) trong các thẻ chuẩn.

Cấu trúc sử dụng phiên bản miền HTTPS hoặc HTTP của thẻ Canonical như sau:

<link rel ="canonical" href = "Link HTTPS hoặc HTTP" />

Quy tắc số 4 – Sử dụng thẻ Canonical tự tham chiếu

Như John Mueller đã đề cập đến việc nên sử dụng các thẻ Canonical tự tham chiếu  có ích:

“Tôi khuyên bạn nên [sử dụng] trang chuẩn tự tham chiếu vì nó thực sự giúp chúng tôi hiểu rõ bạn muốn lập chỉ mục trang nào hoặc URL sẽ là gì khi được lập chỉ mục.

Ngay cả khi bạn có một trang, đôi khi có các biến thể khác nhau của URL có thể kéo trang đó lên. Ví dụ, với các tham số ở cuối cùng, có thể là chữ hoa, chữ thường hoặc www. và không phải www. Tất cả những thứ này có thể được làm sạch bằng một thẻ chuẩn tương đối.”

Thẻ chuẩn tự tham chiếu là thẻ được xác định trên phiên bản chính của trang và không phân biệt các trang trùng lặp ở nơi khác. Tức là, bạn vẫn có quyền đặt thẻ Canonical ngay trên các trang không có nội dung trùng lặp. Thẻ Canonical tự tham chiếu có lợi vì các URL có thể được liên kết với các tham số và thẻ UTM. Cách hoạt động của thẻ Canonical tự tham chiếu sẽ tự trỏ đến chính nó.

Ví dụ:

Một URL đơn giản như sau: https://uptopz.com/pbn-backlink/.

Thì trang chuẩn tự tham chiếu trên trang đó sẽ là:

<link rel="canonical" href="https://uptopz.com/pbn-backlink/" /> 

Quy tắc số 5 – Mỗi trang web chỉ được sử dụng 1 thẻ Canonical

Việc sử dụng các URL tương đối trong các thẻ chuẩn đồng nghĩa với việc, Google sẽ bỏ qua chúng. Các thẻ Canonical tuyệt đối thường được ưu tiên hơn vì chúng cung cấp tín hiệu cụ thể hơn về URL nào được ưu tiên. URL tuyệt đối là các liên kết đến URL đầy đủ gồm tên miền gốc (HTTPS hoặc HTTP). URL tương đối chỉ liệt kê đường dẫn URL. Ví dụ:

  • URL tuyệt đối: https://uptopz.com/pbn-backlink/
  • URL tương đối: /pbn-backlink/

Triển khai nhiều URL tương đối trên trang web vô tình được lập chỉ mục thì sẽ gây ra tín hiệu xung đột, dẫn đến việc Google coi một phiên bản không được ưu tiên của trang là trang chuẩn.

Kết luận

Thật ra Rel=”canonical” không khó như bạn nghĩ. Chúng chỉ hơi khó hiểu lúc mới bắt đầu.

Bạn chỉ nhớ: Thẻ chuẩn không phải là một “chỉ thị”, mà nó là một tín hiệu gợi ý cho các công cụ tìm kiếm.

Bạn có thể sử dụng công cụ kiểm tra URL trong Google Search Console, để xem cả URL chính tắc do người dùng khai báo và URL chính tắc do Google chọn

Xem URL chính tắc do người dùng chọn và URL chính tắc do Google chọn trong trình kiểm tra URL trên Google Search Console.

Và cuối cùng, hãy sử dụng Rel=”canonical” để chỉ ra các phiên bản “chính” trên trang web của bạn! Đừng quên kiểm tra và quản lý tất cả những URL được lập chỉ mục, để đảm bảo mọi thứ đều nằm bên trong tầm kiểm soát của bạn.

Cảm ơn bạn đọc! UptopZ Media hẹn gặp lại bạn trong các hướng dẫn tiếp theo.

Share

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Tiếp tục đọc

Tạo dự án mới

Trong bảng tính Excel bạn cần có 2 cột
(từ khóa bên trái và volume bên phải)
Số từ khóa đã tải lên:0
Số credit hiện tại: 925,256
Số credit còn lại:925,256