Tin tức & Sự kiện
 

Robots META Tag - Metadata Elements

Cập nhập: 26/3/2009

Thường thì tệp tin robots.txt đặt tại thư mục gốc của tên miền là công cụ lý tưởng để giao tiếp với các máy tìm kiếm (Robots với Google, Yahoo và Microsofts) trong việc đánh chỉ số trang web.

Tuy nhiên trong một số trường hợp, tệp tin /robots.txt trở nên hạn chế và việc sử dụng nó rất rườm rà, nặng nề.

Thẻ META “robots” lúc này, lại rất hữu ích ngay cả khi cách sử dụng của nó khá khác so với tệp tin robots.txt

Khái niệm chung

Trước khi đi vào tìm hiểu cách hoạt động củaRobots META Tag thì chúng ta hãy xem xét một vài khái niệm liên quan tới việc đánh chỉ số và theo đường dẫn.

Đánh chỉ số (index page)

“Đánh chỉ số” hay “Chỉ số hóa” trang Web rất tiêc không được định nghĩa trong Robots Exclusion Standard.

Một số người cho rằng việc ngăn không cho đánh chỉ số tương ứng với việc trang đó, trong bất kể trường hợp nào đều không thể xuất hiện trong các kết quả tìm kiếm và nội dung của nó, đặt biệt là các đường liên kết URL, không được khai thác bởi các bọ tìm kiếm đến từ các máy tìm kiếm.

Tuy nhiên cũng có một số cách dịch khác bớt nghiêm khắc hơn. Họ cho rằng việc cấm đánh chỉ số trang Web là việc mà các máy tìm kiếm không sử dụng nội dung của trang để xác định thứ hạng trong kết quả tìm kiếm trong khi đường dẫn URL của trang vẫn xuất hiện bởi các yếu tố khác thu thập được độc lập với việc cấm trên trang này.

Khái niệm “truy vấn liên kết” thì dễ hiểu hơn. Theo đường dẫn được hiểu là các máy tìm kiếm phải bỏ qua đường dẫn mà chúng tìm thấy trong trang. Nó phải xử sự như chưa thấy đường dẫn đó trong trang. Và những đường dẫn này không góp phần nào vào mức độ “phổ biến” của các trang mà liên kết của nó trỏ đến (link URL).

Tuy nhiên rõ ràng là các đường dẫn này có thể được phát hiện trên các trang web khác và bọ tìm kiếm sẽ truy vấn.

Giới thiệu thẻ Metadata Robots

Thẻ META Tag này luôn nằm tại ví trí đầu tiên của mã nguồn HTML tương ứng của trang. Có nghĩa là giữa thẻ HEAD /HEADE.

Qui ước chuẩn của META “robots” liên quan tới việc đánh chỉ số của trang và truy vấn liên kết mà chúng ta sẽ xem xét kỹ phần tiếp theo.

Với thẻ META robots bạn có thể chỉ định cách bọ tìm kiếm quét trang web của bạn. Thẻ META này gồm một số giá trị sau :

all
Bọ tìm kiếm đánh chỉ số tất cả (ngầm định).
none
Bọ tìm kiếm không đánh chỉ số gì hết.
index
Đánh chỉ số trang Web.
noindex
Không đánh chỉ số trang, nhưng vẫn truy vấn đường dẫn URL.
follow
Bọ tìm kiếm sẽ đọc liên kết siêu văn bản trong trang và truy vấn, xử lý sau đó.
nofollow
Bọ tìm kiếm không phân tích liên kết trong trang.
noarchive
Không cho máy tìm kiếm lưu vào bộ nhó bản sao trang Web.
nocache
Chức năng như thẻ noarchive nhưng chỉ áp dụng cho MSN/Live.
nosnippet
Không cho bọ tìm kiếm hiển thị miêu tả sinppet của trang trong kết quả tìm kiếm không cho phép chúng hiển thị trong bộ nhớ (cache hay caching).
noodp
Ngăn máy tìm kiếm khỏi việc tạo các miêu tả description từ các thư mục danh bạ Web DMOZ như là một phần của snippet trong trang kết quả tìm kiếm.
noydir
Ngăn Yahoo khỏi việc trích miêu tả trong danh bạ Web Yahoo! diectory để tạo các phần miêu tả trong kết quả tìm kiếm. Giá trị noydir chỉ áp dụng với Yahoo và không có công cụ tìm kiếm nào khác sử dụng danh bạn Web của Yahoo bởi thế giá trị này không được hỗ trợ cho máy tìm kiếm khác..


Ví dụ :

Trong ví dụ này như các bạn thấytreen hình; máy tìm kiếm sẽ đánh chỉ số trang và tất cả các trang khác nó tìm thấy đường dẫn trong trang chỉ định.

Metadata Robots schema
Hình 1 : Ví dụ sử dụng thẻ Meta robots cho phép đánh chỉ số tất cả.

Máy tìm kiếm sử dụng Robots Meta Tags như thế nào ?

Như chúng ta vừa nghiên cứu các giá trị của thẻ Meta Tag Robots, sau đây là bảng tóm tắt các giá trị được hỗ trợ và sử dụng bởi các máy tìm kiếm phổ biến nhất :

Giá trị thẻ RobotsGoogleYahoo!MSN / LiveAsk
indexKhông
noindex
noneCó thểCó thể
followCó thểCó thể
nofollow
noarchive
nosnippetKhôngKhôngKhông
noodpKhông
noydirKhông dùngKhông dùngKhông dùng

Với các thông tin trong bảng tóm tắt trên thì các bạn có thể điều chỉnh quyền và giới hạn cho bọ tìm kiếm đến từ các máy tìm kiếm với chú ý tên của các bọ tìm kiếm phổ biến tương ứng như sau :

Google
GOOGLEBOT
Yahoo!
SLURP
MSN / Live
MSNBOT
Ask
TEOMA

Ngoài ra đây là một số thông tin đến từ các máy tìm kiếm mà bạn cần tham khảo thêm :

Qui ước chuẩn sử dụng META Robots

Qui ước chung

  • Cú pháp : valeurs“>
  • Ký tự tối đa : Không qui định
  • Tương thích : Với tất cả máy tìm kiếm
  • Phiên bản : HTML 2.0
  • Vị trí : Nằm giữa thẻ và
  • Chức năng : Cho phép chỉ định cách thức máy tìm kiếm đánh chỉ số của trang hoặc cấm một số máy tìm kiếm nếu được chỉ định.
  • Lỗi cần tránh : Không có, thẻ Meta này không nhất thiết bắt buộc.

Giải thích

Phần content=”valeurs” được ngăn cách bởi một dấu phẩy nếu thẻ Robots META Tag gồm nhiều hơn một giá trị bất kể là : none, noindex, nofollow, all, index hay follow.

  1. none : Bọ tìm kiếm (Robots) bỏ qua trang này. Tương đương với noindex, nofollow.
    • noindex : Trang này không được đánh chỉ số.
    • nofollow : Robots sẽ không truy vấn đường dẫn tìm thấy trong trang.
  2. all : Không hạn chế việc đánh chỉ số trang hay truy vấn đường dẫn tìm thấy trong trang nhằm xác định ra các trang cần đánh chỉ số tiếp.
    • index : Robots có thể thêm trang này vào trong các kết quả tìm kiếm.
    • follow : Robots có thể truy vấn địa chỉ đường dẫn URL để tìm ra các trang khác.

Ghi chú vietSEO

Qui ước index, follow hay all không cần phải chỉ định bởi nó được qui định ngầm định.

Nếu như không có thể meta tag, hoặc phần nội dung content của thể này trống hoặc robots không được chỉ định thì robots terms sẽ được hiểu ngầm định là index, follow (tương đương với all). Nếu từ khóa all được tìm thấy trong phần khai báo thì nó sẽ bỏ qua tất cả các giá trị khác. Bởi thế tất cả các giá trị “nofollow, all, noindex, nofollow” sẽ trở thành “all”.

Còn trong trường hợp các giá trị đối ngược (ví dụ “follow, nofollow, follow”) thì bọ tìm kiếm sẽ được tự ý quyết định việc quét trang của mình.

Một số cách dùng thông dụng Robots METATag

Thẻ Robots META Tag được dùng để loại trừ nội dung. Chúng ta hãy cùng xem xét 3 ví dụ sau sử dụng Robots META Tag chính xác để loại trừ thông tin khỏi việc đánh chỉ số và các dịch vụ của máy tìm kiếm.

  1. Sử dụng giá trị noindex để cho phép liên kết được truy vấn dù cho trang không được đánh chỉ số.
    noindex“>
  2. Sử dụng nofollow cho phép trang được đánh chỉ số nhưng đường dẫn trong trang không được truy vấn.
    nofollow“>
  3. Sử dụng none tương đương với noindex, nofollow để cấm cả việc đánh chỉ số và truy vấn đường dẫn.
    none“>

Nếu các bạn muốn các thông tin chỉ tiết hơn về Robots META Tag có hãy tham khảo trên trang chính thức robotstxt.org .

Cuối cùng, như đã nói ở trên, các bạn kết hợp cách sử dụng tệp tin robots.txt và các sử dụng NOFOLLOW với rel=”nofollow” (do Google khởi xướng và được chấp nhận bởi các máy tìm kiếm khác). Ngoài ra, các bạn cũng nên lưu ý việc sử dụng Robots.txt cho Google cũng có nhiều lựa chọn và điểm riêng biệt hơn so với các máy tìm kiếm khác.

Nguồn: Viet Seo


 

Các tin tức khác:


Quang ba Web - Thu thuat Blog - Quảng bá Web site

Tối ưu hoá Công cụ Tìm kiếm (SEO)

iPhone mới hỗ trợ quay video và kết nối tốc độ cao?

Một dịch vụ blog Việt mất dữ liệu 25.000 thành viên

Tối ưu hóa cho tìm kiếm phổ thông và tùy biến

Webmaster và Kiến thức quảng bá Web, Tối ưu Website cho Google

10 thủ thuật SEO tối ưu hóa tiêu đề thân thiện với Google

Thủ thuật tối ưu tiêu đề bài viết Wordpress

Google chỉ dẫn thiết kế, nội dung và chất lượng Website cho Webmaster

Thủ thuật SEO - quảng bá Website

 
[ Quay lại ]
Dịch vụ Hosting lưu trữ website giá rẻ
Thiết kế website giá rẻ
Hướng dẫn đăng ký Thiết kế website
hỗ trợ trực tuyến
 
 
Hoang Nam Fashion
Website Hoang Nam Fashion
Vinh Thang Ceramic
Website Vinh Thang Ceramic
Cha Ca Thang Long Restaurant
Website Cha Ca Thang Long Restaurant
Tu Phuong Viet Nam
Website Tu Phuong Viet Nam
XNK Cát Tường
Website XNK Cát Tường
Thái Phương Anh
Website Thái Phương Anh
Son vina
Website Son vina
Truong Phat JSC
Website Truong Phat JSC
An khang
Website An khang
Tmetco Co.,Ltd
Website Tmetco Co.,Ltd
Thanh Phat Co., Ltd
Website Thanh Phat Co., Ltd
Tin Cậy Việt
Website Tin Cậy Việt
Công ty CP Bình An
Website Công ty CP Bình An
Minh Dan Pharco
Website Minh Dan Pharco
Thang long
Website Thang long
Nha Box Co., Ltd
Website Nha Box Co., Ltd
Haemiin Cosmetic
Website Haemiin Cosmetic
Nhat Tien Hotel
Website Nhat Tien Hotel
An Toàn AT
Website An Toàn AT
Cty DVKT Khoan & Khai thác Mỏ
Website Cty DVKT Khoan & Khai thác Mỏ
Quoc Trung Sound
Website Quoc Trung Sound
Nisentex Paint
Website Nisentex Paint
HTH Truong Phat JSC
Website HTH Truong Phat JSC
Tien Thanh Spices
Website Tien Thanh Spices
Bach Khoa Boiler JSC
Website Bach Khoa Boiler JSC
Alpine Viet
Website Alpine Viet
An Nam Law Firm
Website An Nam Law Firm
Sunrise Travel Vietnam
Website Sunrise Travel Vietnam
Seiken viet nam
Website Seiken viet nam
Ha Thai Tourism
Website Ha Thai Tourism
GIB
Website GIB
Điện tử Hiền Quân
Website Điện tử Hiền Quân
Viet Phap Flower
Website Viet Phap Flower
Vinh Thai JSC
Website Vinh Thai JSC
Hoang Long Education
Website Hoang Long Education
The best of Shop
Website The best of Shop
Hong sam
Website Hong sam
Yoga Viet nam
Website Yoga Viet nam
Livina
Website Livina
Hoàng Phương
Website Hoàng Phương
Uvip Việt
Website Uvip Việt
Xuân Thành
Website Xuân Thành
Jutland
Website Jutland
My Hung Fashion
Website My Hung Fashion
Ô tô Đức Hòa
Website Ô tô Đức Hòa
Hcare
Website Hcare
 
 
 
D&N ADVERTISING
78 Đốc Ngữ Ba Đình Hà Nội
04 37616026  -  37616684
04 37616032
0912254998
 
 
Thiet ke web, Thiet ke website, Thiet ke web cho doanh nghiep, thiet ke web cho cong ty thiet ke website cho doanh nghiep, thiet ke website cho cong ty, thiet ke web dep mat, thiet ke web chuyen nghiep, thiet ke web doc dao, thiet ke web an tuong, thiet ke web, ky thuat thiet ke website, tu van thiet ke website cho doanh nghiep, tu van thiet ke web cho cong ty, tai sao phai thiet ke web ?
microsoft.netphpMySQLJavaHelmCpanelDirectadminCentosdirectivnnic