Bài viết này chỉ ra các lỗi thường gặp với thẻ canonical và cách khắc phục tốt nhất cho SEO. UptopZ Media hi vọng đây sẽ là thông tin hữu ích giúp quá trình khai báo của bạn sớm nhận tín hiệu phản hồi tích cực từ Google.
Để bắt đầu, hãy kiểm tra thẻ rel=”canonical và tiến hành sửa lỗi cùng với chúng tôi!
Lỗi 1: Sử dụng URL tương đối
Google đã đề cập, một trong những vấn đề phổ biến mà họ thường gặp với canonical xuất phát từ việc khai báo URL tương đối.
URL tuyệt đối bao gồm: Giao thức (http/https), tên miền và đường dẫn đến tệp. URL tương đối là một phần của URL tuyệt đối (không chứa “http://” hoặc “https://” và tên miền), là phần đường dẫn đến tệp.
Ví dụ:
- Chỉ định thẻ canonical chuẩn với URL tuyệt đối:
<link rel=”canonical” href=”https://example.com/sample-post.html” />
- Chỉ định thẻ canonical chuẩn với URL tương đối:
<link rel=”canonical” href=”/sample-post.html” />
Khi bạn sử dụng URL tuyệt đối làm URL chính tắc, bot tìm kiếm sẽ hiểu rằng bạn đang muốn chỉ định trang có địa chỉ https://example.com/sample-post.html
là trang có nội dung chính.
Thế nhưng, nếu bạn sử dụng URL tương đối <link rel=”canonical” href=”/sample-post.html” />
, bot tìm kiếm sẽ khó xác định được bạn đang muốn chỉ định đâu là trang có nội dung chính.
Thêm vào đó, có những trường hợp chỉ định sai cấu trúc của một URL tương đối (ví dụ: <link rel=”canonical” href=”example.com/sample-post.html” />
), điều này sẽ khiến cho bot tìm kiếm bỏ qua khai báo trong thẻ Rel=”canonical”. Cho nên việc sử dụng URL tương đối khi thực hiện khai báo canonical sẽ không có được kết quả như mong muốn.

Lỗi 2: Liên kết Rel=”canonical” bị lỗi 404
Ngoài khắc phục sự cố trùng lặp nội dung, thì mục tiêu cuối cùng của việc sử dụng rel=”canonical” là yêu cầu công cụ tìm kiếm thu thập và lập chỉ mục cho trang chính của bạn. Nếu URL trỏ đến trang chính bị gãy (trang không tồn tại hoặc trang bị lỗi 404) thì Bot sẽ bỏ qua thẻ canonical và tự động chọn một URL bất kì làm URL chính tắc.

Để khắc phục lỗi này, bạn cần kiểm tra lại trang chính (URL canonical) để xem trang đó còn tồn tại hay không. Nếu nó không tồn tại bạn có thể chọn một trong hai cách sau để sửa:
- Cách 1: Chuyển hướng 301 URL lỗi 404 về một URL khác có thể truy cập được.
- Cách 2: Thay thế URL lỗi 404 trong thẻ canonical bằng một URL có thể truy cập được và sửa tất cả các liên kết trỏ về URL cũ cho URL mới được chỉ định trên trang của bạn.
Lỗi 3: Gắn nhiều thẻ Canonical trên cùng một trang
Thẻ canonical được dùng để chỉ ra trang chính. Vì thế tất cả các trang trùng lặp chỉ được thêm một thẻ chuẩn duy nhất và trỏ về URL của trang chính.

Nếu nhiều thẻ rel=”canonical” sinh ra trên trang không nằm trong chủ đích của bạn, nó có thể xuất phát từ các Plugin SEO bên trong website nếu chúng mặc định chèn thêm liên kết rel=”canonical”.
Vì vậy, hãy kiểm tra lại các Plugin SEO của bạn, giữ lại một thẻ rel=”canonical” duy nhất trỏ về URL mà bạn muốn chỉ định làm URL chính tắc và loại bỏ tất cả các thẻ khác ra khỏi trang.
Lỗi 4: Gắn thẻ Canonical trong phần <body>
Các chỉ định về Canonical trong SEO phải được đặt ở phần <head> của một tài liệu HTML.
Nếu bạn đặt rel=”canonical” trong phần <body> thì Bot sẽ mặc định bỏ qua.

Vì vậy, hãy đưa tất cả các thẻ canonical trong phần <body> về phần <head> trên trang. Tối ưu hơn, là bạn nên đặt nó ở vị trí càng cao trong phần <head> càng tốt.
Lỗi 5: Dùng rel=”canonical” trỏ đến trang đầu tiên trong loạt phân trang (Pagination)
Pagination là cách phân chia một lượng dữ liệu lớn nhưng không thể trình bày trên một trang duy nhất thành nhiều trang riêng lẻ. Mặc dù nó dùng kỹ thuật rel=”next” và rel=”prev” để tạo sự kết nối giữa những trang có nội dung gần giống nhau thành một chuỗi trang, nhưng bản chất những trang này là trang riêng biệt và không được xem là trùng lặp.
Ví dụ:
example.com/blog?p=1
example.com/blog?p=2
- và tiếp tục.
Nếu bạn chỉ định rel=”canonical” từ trang 2 (hay bất kỳ trang nào phía sau) đến trang 1 đều không chính xác, trừ khi bạn chỉ muốn công cụ tìm kiếm lập chỉ mục cho trang đầu tiên. Bởi vì chúng không phải là các URL trùng lặp nội dung, gắn nhãn như thế là hoàn toàn không đúng với ý nghĩa của thẻ canonical. Và điều này có thể làm cản trở quá trình cào dữ liệu của Bot, tệ hơn là các trang đó đều có thể không được lập chỉ mục.
Lỗi 6: Canonical với phiên bản HTTP và HTTPS
Khi trang web của bạn đang có phiên bản bảo mật HTTPS, nhưng thẻ rel=”canonical” lại yêu cầu bot công cụ tìm kiếm chỉ định URL HTTP là phiên bản chính. Điều này dẫn đến việc URL HTTP được lập chỉ mục trên SERP và khi người dùng bấm vào, trình duyệt sẽ chặn họ lại với thông báo rằng địa chỉ website này không an toàn để truy cập.
Vì vậy, để khắc phục lỗi này bạn nên:
- Chuyển hướng phiên bản HTTP sang phiên bản HTTPS bằng lệnh Redirect 301 (thông thường được thực hiện trên host).
- Đánh dấu phiên bản HTTPS là phiên bản ưu tiên bằng cách thêm rel = “canonical” vào các trang HTTP.
Lỗi 7: Xung đột Canonical và Hreflang
Trong SEO, thẻ hreflang được dùng để yêu cầu công cụ tìm kiếm theo dõi và lập chỉ mục tất cả các phiên bản ngôn ngữ của một trang và thẻ canonical chỉ dùng để yêu cầu lập chỉ mục cho một phiên bản chính duy nhất.

Nếu bạn thêm thẻ canonical để chuẩn hóa một trang trong một loạt trang thay thế, trong khi hreflang chỉ định công cụ tìm kiếm các lựa chọn thay thế khác nhau của trang, điều này dẫn đến xung đột giữa canonical và hreflang, nó khiến Bot hiểu nhầm và bỏ qua các thiết lập hreflang trên trang web của bạn.
Do đó, khi kết hợp hai thẻ này bạn hãy nhớ kỹ điều này: “Mỗi ngôn ngữ chỉ có một thẻ rel=”canonical” duy nhất và trỏ đến chính nó.”
Bài viết liên quan:
Kết luận:
Trên đây là bài viết về các lỗi thường gặp với Canonical và cách khắc phục chúng tốt nhất cho trang web SEO. Hi vọng những gì UptopZ Media cung cấp có thể giúp bạn hiểu rõ hơn về những lỗi này. Nếu bạn có bất kỳ góp ý nào hãy vui lòng để lại bình luận bên dưới, chúng tôi sẽ cố gắng phản hồi sớm nhất có thể. Đừng quên chia sẻ nếu thấy hữu ích bạn nhé!
Cảm ơn bạn đã đọc bài! UptopZ Media rất hân hạnh nếu được gặp lại bạn trong các hướng dẫn tiếp theo.