Diagnosis kegagalan merangkak labah-labah Baidu soket maklumat tidak normal membaca dan menulis ralat tamat masa sambungan perkara yang perlu dilakukan

Baidu Spider menangkap maklumat pengecualian diagnostik: Apakah yang perlu saya lakukan jika soket membaca dan menulis dengan tidak betul?

Dengan mengandaikan bahawa tapak web anda tidak disertakan oleh Baidu, anda mesti melakukan diagnosis merangkak labah-labah dahulu pada platform sumber carian Baidu.

Apakah yang perlu saya lakukan jika perangkak Baidu gagal merangkak pautan diagnostik?

Jika diagnosis rangkak perangkak Baidu gagal beberapa kali, tembok api mungkin telah menyekat program perangkak.

Platform Sumber Carian Baidu > Diagnosis Rangkakan > Maklumat Pengecualian Rangkakan: Ralat baca dan tulis soket ▼

Selesaikan kesalahan merangkak labah-labah Baidu diagnosis pengecualian soket maklumat baca dan tulis ralat tamat masa sambungan

  • Terutama apabila menggunakan Cloudflare CDN, ia disekat secara lalai.
  • Di Internet, dikatakan menambah alamat IP xxx.xxx.xxx.xxx/24
  • Walau bagaimanapun, cuba itu tidak berjaya.

Saya tidak menyekat labah-labah Baidu pada pelayan, jadi masalahnya adalah WAF Cloudflare!

Log masuk ke Cloudflare → Keselamatan → WAF → Peraturan Firewall → Cipta Peraturan Firewall

  • Cari peraturan WAF yang berkaitan dengan perangkak di Cloudflare dan temui pilihan "perakak robot yang sah" ▼

Apakah yang salah dengan perangkak Baidu kegagalan merangkak Peta laman dan tamat masa sambungan?lembaran 2

    • Selepas mencipta peraturan tembok api, tunggu selama 10 minit, kemudian ambil diagnosis, dan kesemuanya berjaya ditangkap!

Apakah yang salah dengan perangkak Baidu kegagalan merangkak Peta laman dan tamat masa sambungan?

Jika anda menyerahkan alamat fail Peta Laman pada platform sumber carian Baidu, akan ada masalah seperti kegagalan merangkak dan tamat masa sambungan ▼

Diagnosis kegagalan merangkak labah-labah Baidu soket maklumat tidak normal membaca dan menulis ralat tamat masa sambungan perkara yang perlu dilakukan

Penyelesaian kepada kegagalan perangkak Baidu untuk merebut peta Peta Laman

Log masuk ke Cloudflare → Keselamatan → WAF → Peraturan Firewall → Cipta Peraturan Firewall ▼

  1. medan, pilih "Ejen Pengguna"
  2. operator, pilih Mengandungi
  3. Tambah ejen pengguna baharu, klik "Atau" terakhir
  4. Nilai, masing-masing masukkan ejen pengguna Baidu Spider UA berikut:
    • Baiduspider/2.0
    • Baiduspider-image
    • Baiduspider-render/2.0
    • http://www.baidu.com/search/spider.html
    • Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)
    • Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

    Selepas selesai, uji pengambilan sekali lagi dan hasilnya mengembalikan pengepala HTTP 200, menunjukkan bahawa pengambilan itu berjaya▼

    • 抓取诊断 > 抓取详情
      以下是百度Spider抓取结果及页面信息:
    • 提交网址: https://www.etufo.org/sitemap_baidu.xml
    • 抓取网址: https://www.etufo.org/sitemap_baidu.xml
    • 抓取UA: Mozilla/5.0 (compatible; Baiduspider/2.0;
    • +http://www.baidu.com/search/spider.html)
    • 抓取时间: 2022-11-11 19:03:44
    • 网站IP: 172.***.***.149
    • 下载时长: 0.868秒
    • 返回HTTP头:HTTP/2 200

    Ejen pengguna labah-labah dan perangkak lain juga boleh mencari sendiri dengan cara yang sama.

    发表 评论

    Alamat e-mel anda tidak akan diterbitkan. 必填 项 已 用 * 标注

    Tatal ke