Làm sao để ngăn chặn GoogleBot tạm thời và vĩnh viễn?

Theo thông tin từ John Mueller trong diễn đàn Google Webmaster Help về chủ đề Google chặn nội dung trên một trang cụ thể.

John Mueller giải thích có rất nhiều cách để ngăn chặn Google index trang web của bạn nhưng kỹ thuật này sẽ khác nhau dựa vào khoảng thời gian bạn muốn chặn việc index từ Google. Thường thì tôi thấy rằng các quản trị web không rõ xử lý việc này như thế nào, vì vậy đây là lời khuyên của John Mueller:
Nếu bạn không muốn nội dung được index (có thể bạn đang cố gắng đạt được một cái gì đó trên trang) thì bạn có thể sử dụng tập tin robots.txt – đó là một cách tiếp cận tốt

Nếu bạn muốn tạm thời ngăn chặn thì bạn chỉ cần một mã phản hồi HTTP 503 (503 HTTP response code)

Nếu bạn muốn loại bỏ trang từ tìm kiếm thì bạn nên sử dụng noindex trong robots.txt

Nếu bạn đang sử dụng máy chủ và không muốn được index, hãy hạn chế quyền truy cập vào các dãy địa chỉ IP hoặc sử dụng xác thực phía máy chủ - đây là cách tiếp cận rất tuyệt vời.

Làm sao để ngăn chặn GoogleBot tạm thời và vĩnh viễn

John nói thêm rằng không lặp lai kỹ thuật này trên một trang duy nhất vì nó sẽ gây nhầm lẫn cho GoogleBot. Ông viết:

Có một điều mà tôi muốn tránh những biến động nhanh chóng. Loại bỏ nội dung từ tìm kiếm và sau đó đưa nó trở lại, đôi khi nó có thể dẫn đến việc chúng tôi không thu thập lại nhanh như bạn mong muốn và do đó nó mất một chút thời gian cho để đưa các trang vào tìm kiếm. Nếu bạn có thể tránh được bằng cách chạy thử nghiệm của bạn trên một trang web riêng biệt thì rất tốt. Tất nhiên, nếu bạn đang tìm kiếm một cái gì đó để loại bỏ vĩnh viễn thì đó lại là một vấn đề khác.Theo thông tin từ John Mueller trong diễn đàn Google Webmaster Help về chủ đề Google chặn nội dung trên một trang cụ thể.

John Mueller giải thích có rất nhiều cách để ngăn chặn Google index trang web của bạn nhưng kỹ thuật này sẽ khác nhau dựa vào khoảng thời gian bạn muốn chặn việc index từ Google. Thường thì tôi thấy rằng các quản trị web không rõ xử lý việc này như thế nào, vì vậy đây là lời khuyên của John Mueller:
Nếu bạn không muốn nội dung được index (có thể bạn đang cố gắng đạt được một cái gì đó trên trang) thì bạn có thể sử dụng tập tin robots.txt – đó là một cách tiếp cận tốt

Nếu bạn muốn tạm thời ngăn chặn thì bạn chỉ cần một mã phản hồi HTTP 503 (503 HTTP response code)

Nếu bạn muốn loại bỏ trang từ tìm kiếm thì bạn nên sử dụng noindex trong robots.txt

Nếu bạn đang sử dụng máy chủ và không muốn được index, hãy hạn chế quyền truy cập vào các dãy địa chỉ IP hoặc sử dụng xác thực phía máy chủ - đây là cách tiếp cận rất tuyệt vời.

John nói thêm rằng không lặp lai kỹ thuật này trên một trang duy nhất vì nó sẽ gây nhầm lẫn cho GoogleBot. Ông viết:

Có một điều mà tôi muốn tránh những biến động nhanh chóng. Loại bỏ nội dung từ tìm kiếm và sau đó đưa nó trở lại, đôi khi nó có thể dẫn đến việc chúng tôi không thu thập lại nhanh như bạn mong muốn và do đó nó mất một chút thời gian cho để đưa các trang vào tìm kiếm. Nếu bạn có thể tránh được bằng cách chạy thử nghiệm của bạn trên một trang web riêng biệt thì rất tốt. Tất nhiên, nếu bạn đang tìm kiếm một cái gì đó để loại bỏ vĩnh viễn thì đó lại là một vấn đề khác.

Nguồn: thegioiseo.com

googlebot tin seo

Thời gian đăng bài viết Tác giả: quanly | Thời gian đăng bài viết Đăng lúc: | Thời gian sửa lần cuối bài viết Lần sửa cuối: 08/04/15 19:50 | Đếm số lượt xem Số lượt xem: 7,353

Bài viết liên quan

Hãy là người đầu tiên viết bình luận