Chủ nhật, 01 Tháng 8 2010

Canonical - Khắc phục lỗi trùng lặp nội dung trong SEO

Thứ tư, 01 Tháng 4 2009 23:31   


do-not-duplicateGần đây rất nhiều chuyên trang về SEO trên thế giới đã nhắc đến một thẻ mới trong coding tương tự thẻ rel="nofollow", nhưng chức năng lại dùng để khắc phục lỗi trùng lặp nội dung trong việc tối ưu hóa website. Qua tìm hiểu của SEO Việt Nam thì cả 3 ông lớn trong lĩnh vực tìm kiếm là Google, Yahoo và MSN đều tuyên bố hỗ trợ thẻ rel="canonical" theo sau các đường link nhằm khắc phục lỗi trùng lặp nội dung của các website. Hôm nay SEO Việt Nam viết 1 bài nhằm giới thiệu về chức năng chính, hướng dẫn sử dụng và đồng thời cung cấp cho các bạn  plugin canonical cho cả Joomla, Wordpress.

1. Chức năng :

Phần này để nói qua về bản chất của trùng lặp nội dung (duplicate content) được tao ra khi nào:

- Khi tags được sử dụng và chuyển đến bản gốc của mã nguồn trong một hệ thống CMS.
- Khi website của bạn chưa được tối ưu hóa cấu hình đúng trên server cấp cơ sở (tức là sự không đống bộ giưa http:// và http://www. hoặc tồn tại nhiều trang chủ dạng domain/ và domain/index.php...)
xem thêm .htaccess và redirect 301
- Khi các url chưa các mã số theo dõi, track code, id...
- Khi có nhiều biến thể của 1 trang, có thể là thiếu nội dung (vì vậy mặc định chuyển hướng và khía cạnh nội dung được xem như tương tự) hoặc chứa 1 khả năng chính xác cao với một số từ và cụm từ.

Và chức năng chính của thẻ rel="canonical" ở đây chính là phân biệt url chủ, như vậy các trang không phải đấu tranh với các bản sao của mình, nhờ đó search engine có thể dễ dàng loại bỏ việc đánh chỉ mục các trang trùng lặp.

canonical-url

2. Cách sử dụng :

Như ở trên mình đã nói thẻ rel="canonical" hoàn toàn tương tự như rel="nofollow", việc sử dụng cũng khá đơn giản.

Một ví dụ cho dễ hiểu: ở đây bạn có 2 url cùng 1 nội dung là

http://www.website.com/product.php?item=landing-page1

http://www.website.com/product.php?item=landing-page1&trackingid=2742&sessionid=9361

(Lỗi như 2 url trên thường rất hay xuất hiện trong nhưng website thương mại điện tử, có chứa các chức năng cung cấp giỏ hàng)

như vậy việc sử dụng chỉ cần phần biệt url chủ và thêm vào thẻ canonical vào trước hoặc sau url như thế này :

link rel=”canonical” href=”http://www.website.com/product.php?item=landing-page1″

Như vậy các seach engine sẻ nhận http://www.website.com/product.php?item=landing-page1 làm url chủ, và sẻ không đánh chỉ mục đối với http://www.website.com/product.php?item=landing-page1&trackingid=2742&sessionid=9361.

3. Download Plugin

Link download:

 
Joomla plugin: http://www.megaupload.com/?d=JZBKDR1Q
Wordpress plugin: http://www.megaupload.com/?d=G8MLMNPW
Pass Unzip :
seovietnam.org
 

Lưu ý: Plugin cho joomla chỉ sử dụng được với joomla 1.5x, và yêu cầu sử dụng kèm với sh404sef (chỉ có sh404sef thôi nha, mấy cái SEF khác không chịu trách nhiệm đâu). Thêm nữa, không biết sài chung với các extension khác có sao không, tại ko có thời gian ngồi test.

Minh Đại - SEO Việt Nam
(Yêu cầu ghi rõ nguồn khi sử dụng bài viết này)



Comments

avatar Hương Lan
-1
 
 
Mình cũng tìm hiểu sơ qua về duplicate content trong SEO nhưng vẫn chưa hiểu rõ lắm về khái niệm này.
Bài viết rất hay, đã giải đáp hầu hết thắc mắc của mình. Thank you

Về thẻ canonical gì gì đó thì vẫn chưa thấy ai nói đến cả, chỉ có mình bạn thôi đó ^_^
B
i
u
Quote
Code
List
List item
URL
Name *
Email *
URL
Code   
Submit Comment
Hủy
avatar Tinh
+1
 
 
Hay, minh da doc qua nhieu bai. Quan trong nhat la bai cua Matt Cutts. Minh da ap dung bang mot plugin cua Yoast roi. Ma sao bac noi cho ca wp ma sao chi cho joomla the?
B
i
u
Quote
Code
List
List item
URL
Name *
Email *
URL
Code   
Submit Comment
Hủy
avatar SEO
0
 
 
Có cả plugin cho wordpress ở trên đây thây bác, e đã viết rõ ràng là wordpress plugin, bên cạnh joomla plugin đó . Thiệt tình ^^
B
i
u
Quote
Code
List
List item
URL
Name *
Email *
URL
Code   
Submit Comment
Hủy
avatar Tinh
0
 
 
ô, mình đọc bằng mobile nên không nhìn thấy, bác thông cảm nhé :-)
B
i
u
Quote
Code
List
List item
URL
Name *
Email *
URL
Code   
Submit Comment
Hủy
avatar Torres
0
 
 
Bài viết rất hay
B
i
u
Quote
Code
List
List item
URL
Name *
Email *
URL
Code   
Submit Comment
Hủy
avatar HaiTac
0
 
 
Tớ chưa hiểu lắm ...... down plugin về cài rồi, active rồi .... rồi sao nữa ........ thêm thẻ canonical vào url ở đâu ..... giúp mình cái ^^
B
i
u
Quote
Code
List
List item
URL
Name *
Email *
URL
Code   
Submit Comment
Hủy
avatar SEO
0
 
 
Thiệt tình cái cậu này, đọc kĩ hướng dẫn đi chứ. Canonical cung tương tự như thẻ nofollow chỉ có điều chức năng là anti duplicate content thôi mà.

Nếu cậu sài trình duyệt firefox 3.5x thì khi vào link này: http://www.seovietnam.org/Optimization/Canonical-Khac-phuc-loi-trung-lap-noi-dung-trong-SEO.html#commentID700

sẽ thấy một biểu tượng chữ C màu xanh xuất hiện bên trên trong phần address bar, bên cạnh hình ngôi sao. Đây là dấu hiệu nhận biết link này khong phỉa là link gốc, mà link gốc sẽ là link: http://www.seovietnam.org/Optimization/Canonical-Khac-phuc-loi-trung-lap-noi-dung-trong-SEO.html

Còn nếu trong trường hợp cậu không sử dụng firefox thì chỉ cần view source tìm đến phần link của bài viết là sẻ thấy biến canonical đã được add.

B
i
u
Quote
Code
List
List item
URL
Name *
Email *
URL
Code   
Submit Comment
Hủy
avatar HaiTac
0
 
 
a ... bây giờ thì em đã hiểu ^^ Cám ơn cậu nhé ^^ cậu nhiệt tình wá ^^
B
i
u
Quote
Code
List
List item
URL
Name *
Email *
URL
Code   
Submit Comment
Hủy
làm cách nào để tránh duplicate cho sh404sef cậu ơi
B
i
u
Quote
Code
List
List item
URL
Name *
Email *
URL
Code   
Submit Comment
Hủy
avatar leminhvina
0
 
 
Thẻ này mình sẽ đặt ở đâu trong mã nguồn? Mình đọc nhưng vẫn chưa rõ lắm, mong được giúp đõ
B
i
u
Quote
Code
List
List item
URL
Name *
Email *
URL
Code   
Submit Comment
Hủy
B
i
u
Quote
Code
List
List item
URL
Name *
Email *
URL
Code   
Submit Comment