Domain, hosting, vps giá rẻ
Kết quả 1 đến 1 của 1

Chủ đề: Hướng dẫn tạo và sử dụng file robots.txt cho website

  1. #1
    nghiatichxanh1992's Avatar
    Bài viết
    5,037
    Cấp độ
    Bang hội
    Tiếu Ngạo
    Tu luyện
    Độ kiếp Hư Thần
    Giới tính
    Con trai
    Join Date
    Jun 2012
    Đến từ
    Hà Giang
    Tuổi
    31
    Danh vọng
    10
    Điện thoại
    0367790762

    Hướng dẫn tạo và sử dụng file robots.txt cho website

    Tại sao cần phải tạo file robots.txt ?
    - Khi các robot của bộ máy tìm kiếm ghé thăm một website nào đó thì nó sẽ ghẽ thăm file robots.txt đâu tiên vì đây chính là bảng chỉ dẫn cho các robot tìm kiếm thông tin

    File robots.txt là gì? Công dụng của file robots.txt?
    - File robots.txt là một dạng file text có đươi .txt chứa các câu lệnh để hướng dẫn cho các robot tìm kiếm của google nên đọc những file nào và index file nào khi vào website.
    - File robots.txt là một tập tin văn bản đơn giản (không chứa các mã HTML) được đặt trong thư mục gốc của website (ngang cấp với file index.*(index.htm, index.php, default.aspx,….)

    Ví dụ: www.ketnoi123.com/robots.txt

    Hướng dẫn tạo file robots.txt
    - để tạo tập tin robots.txt bạn mở chương trình Notepad và gõ các lệnh, sau đó lưu lại với tên robots.txt và chép vào thư mục gốc của website.



    Các lênh cơ bản như sau
    User-agent: *
    Allow: /duocdocfilenay/
    Disallow: /khongdocfilenay/


    User-agent: dùng để xác định bot của công cụ tìm kiếm.
    Allow: Cho phép bot vào thư mục nào đó.
    Disallow: Không cho bot đọc file nào đó.

    - Ở ví dụ trên hướng dẫn cho phép bot đọc file duocdocfilenay, và không cho phép bot đọc file khongdocfilenay.

    Một số ứng dụng của file robots.txt:

    1. Chặn không cho bot google vào web
    User-agent: *
    Disallow: /


    - Với những câu lệnh trên trì không có công cụ tìm kiếm nào lập chỉ mục (index) bất kỳ trang nào trong website của ban, nghĩa là các bài viết hay sản phẩm trong website của bạn sẽ không xuất hiện trong kết quả tìm kiếm của google

    2. Không cho bot đọc một thư mục hay một trang nào đó
    User-agent: *
    Disallow: /khongxem.html/
    Disallow: /test.html/


    - Với những câu lệnh ở trên có nghĩa là cho phép bot đọc tất cả các file trong web trừ 2 file khongxem.html và test.html

    3. Chặn một bot nào đó
    User-agent: Spambot
    Disallow: /
    User-agent: *
    Disallow: /wp-includes/


    - Spambot bị cấm truy cập tất cả các thư mục web còn các web khác được truy cập tất cả các thư mục trừ file wp-includes

    4. Chỉ cho phép bot đọc một thư mục hoặc một trang nào đó
    User-agent: *
    Allow: /bai-viet/
    Allow: /demo.html
    Disallow: /wp-includes/


    - Cho phép tất cả các bot truy cập vào thư mục bai-viet và trang demo.html nhưng không được đọc thư mục wp-includes
    cach tao file robot txt

    5. Chặn bot vào nhiều bài có cấu trúc đường dẫn giống nhau
    - VD: Chúng ta có hai đường dẫn như sau
    www.ketnoi123.com/geolat10=1235345
    www.ketnoi123.com/geolat12=1345

    - Chúng ta muốn chặn bot truy cập vào tất cả các đường dẫn dạng này thì làm thế nào? Các bạn nhìn kỹ sẽ thấy trong 2 URL trên có phần chung là /geolat là cấu trúc giống nhau của 2 hoặc nhiều URL. Chúng ta sẽ chăn bot bằng lệnh sau
    Disallow: /geolat*
    Lần sửa cuối bởi nghiatichxanh1992, ngày 16/04/2016 lúc 14:13.
    Diễn đàn chia sẻ kiến thức điện thoại: http://chiase123.com
    Click vào Hiện ra để xem chữ ký của mình

Thông tin về chủ đề này

Users Browsing this Thread

Có 1 người đang xem chủ đề. (0 thành viên và 1 khách)

Các Chủ đề tương tự

  1. Hướng dẫn chặn IP bằng file .htaccess khi website bị tấn công ddos, spam
    Bởi nghiatichxanh1992 trong diễn đàn Hosting - Domain
    Trả lời: 0
    Bài viết cuối: 14/01/2016, 0:24
  2. Hướng dẫn kiểm tra và tối ưu hóa website online
    Bởi nghiatichxanh1992 trong diễn đàn HTML / CSS / Javascript
    Trả lời: 0
    Bài viết cuối: 01/10/2015, 22:09
  3. Website của diễn viên Hàn Quốc Lee Min Ho bất ngờ bị hacker VN tấn công
    Bởi nghiatichxanh1992 trong diễn đàn Thảo luận - Tán gẫu
    Trả lời: 0
    Bài viết cuối: 01/12/2013, 11:17
  4. [Game PC] SHOOT MANY ROBOTS - Đơn giản mà hay [3DM][2012]
    Bởi nghiatichxanh1992 trong diễn đàn Thể loại khác
    Trả lời: 0
    Bài viết cuối: 23/03/2013, 16:56
  5. [Game PC] Shoot Many Robots - RELOADED [Full ISO/Action/2012]
    Bởi nghiatichxanh1992 trong diễn đàn Thể loại khác
    Trả lời: 0
    Bài viết cuối: 15/03/2013, 22:52

Tag của Chủ đề này

Quyền viết bài

  • Bạn Không thể gửi Chủ đề mới
  • Bạn Không thể Gửi trả lời
  • Bạn Không thể Gửi file đính kèm
  • Bạn Không thể Sửa bài viết của mình
  •