Baidu spider thu thập thông tin thất bại chẩn đoán lỗi ổ cắm thông tin bất thường đọc và ghi lỗi kết nối thời gian chờ phải làm gì

Baidu Spider thu thập thông tin và chẩn đoán thông tin bất thường: Tôi nên làm gì nếu ổ cắm bị đọc hoặc ghi?

Giả sử rằng trang web của bạn chưa được Baidu lập chỉ mục, trước tiên bạn phải thực hiện chẩn đoán thu thập dữ liệu mạng nhện trên nền tảng tài nguyên tìm kiếm Baidu.

Tôi nên làm gì nếu trình thu thập thông tin của Baidu không thể thu thập thông tin liên kết chẩn đoán?

Nếu trình thu thập thông tin của Baidu không thể thu thập thông tin và chẩn đoán nhiều lần, tường lửa có thể đã chặn trình thu thập thông tin.

Nền tảng tài nguyên tìm kiếm Baidu> Chẩn đoán thu thập thông tin> Thu thập thông tin bất thường: lỗi đọc / ghi ổ cắm ▼

Baidu spider thu thập thông tin thất bại chẩn đoán lỗi ổ cắm thông tin bất thường đọc và ghi lỗi kết nối thời gian chờ phải làm gì

  • Đặc biệt là khi sử dụng Cloudflare CDN, bị chặn theo mặc định.
  • Trên internet, có thảo luận về việc thêm địa chỉ IP xxx.xxx.xxx.xxx/24
  • Tuy nhiên, cố gắng không có kết quả.

Tôi không chặn nhện Baidu trên máy chủ, vì vậy vấn đề phải là WAF của Cloudflare!

Đăng nhập vào Cloudflare → Bảo mật → WAF → Quy tắc tường lửa → Tạo quy tắc tường lửa

  • Tìm kiếm các quy tắc WAF liên quan đến trình thu thập thông tin trên Cloudflare và tìm thấy tùy chọn "Trình thu thập thông tin robot hợp pháp" ▼

Sơ đồ trang web của trình thu thập thông tin Baidu không thể thu thập thông tin, kết nối đã hết thời gian chờ?lần 2

    • Sau khi tạo các quy tắc tường lửa, hãy đợi trong 10 phút, sau đó lấy chẩn đoán và tất cả chúng đều được lấy thành công!

Sơ đồ trang web của trình thu thập thông tin Baidu không thể thu thập thông tin, kết nối đã hết thời gian chờ?

Nếu địa chỉ tệp sơ đồ trang web được gửi trên nền tảng tài nguyên tìm kiếm Baidu, sẽ có vấn đề về lỗi thu thập thông tin và thời gian chờ kết nối ▼

Baidu spider thu thập thông tin thất bại chẩn đoán lỗi ổ cắm thông tin bất thường đọc và ghi lỗi kết nối thời gian chờ hình ảnh 3

Trình thu thập thông tin Baidu không thể thu thập thông tin giải pháp Sơ đồ trang web

Đăng nhập vào Cloudflare → Bảo mật → WAF → Quy tắc tường lửa → Tạo Quy tắc tường lửa ▼

  1. trường, chọn Tác nhân người dùng
  2. toán tử, chọn "chứa"
  3. Thêm tác nhân người dùng mới, nhấp vào "Hoặc" ở cuối
  4. , nhập tác nhân người dùng Baidu Spider UA tương ứng sau:
    • Baiduspider/2.0
    • Baiduspider-image
    • Baiduspider-render/2.0
    • http://www.baidu.com/search/spider.html
    • Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)
    • Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

    Sau khi hoàn thành, hãy kiểm tra và tìm nạp lại, và kết quả trả về tiêu đề HTTP 200, cho biết rằng quá trình tìm nạp đã thành công ▼

    • 抓取诊断 > 抓取详情
      以下是百度Spider抓取结果及页面信息:
    • 提交网址: https://www.etufo.org/sitemap_baidu.xml
    • 抓取网址: https://www.etufo.org/sitemap_baidu.xml
    • 抓取UA: Mozilla/5.0 (compatible; Baiduspider/2.0;
    • +http://www.baidu.com/search/spider.html)
    • 抓取时间: 2022-11-11 19:03:44
    • 网站IP: 172.***.***.149
    • 下载时长: 0.868秒
    • 返回HTTP头:HTTP/2 200

    Tác nhân người dùng của trình thu thập thông tin và trình thu thập thông tin khác cũng có thể tự tìm kiếm theo cách tương tự.

    Hy vọng Chen Weiliang Blog ( https://www.chenweiliang.com/ ) đã chia sẻ "Baidu spider thu thập thông tin thất bại trong việc chẩn đoán lỗi đọc và ghi thông tin bất thường socket thông tin phải làm gì khi kết nối hết thời gian chờ", hữu ích với bạn.

    Chào mừng bạn đến chia sẻ liên kết của bài viết này:https://www.chenweiliang.com/cwl-29315.html

    Chào mừng bạn đến với kênh Telegram trên blog của Chen Weiliang để cập nhật những thông tin mới nhất!

    🔔 Hãy là người đầu tiên nhận được "Hướng dẫn sử dụng Công cụ AI tiếp thị nội dung ChatGPT" có giá trị trong thư mục trên cùng của kênh! 🌟
    📚 Hướng dẫn này chứa đựng giá trị to lớn, 🌟Đây là cơ hội hiếm có, đừng bỏ lỡ! ⏰⌛💨
    Chia sẻ và thích nếu bạn thích!
    Chia sẻ và thích của bạn là động lực không ngừng của chúng tôi!

     

    发表 评论

    Địa chỉ email của bạn sẽ không được công bố. 项 已 * 标注

    cuộn lên trên cùng