Baidu Spider Crawl Gagal Diagnosis Abnormal Émbaran Socket Baca jeung Tulis Kasalahan Connection Timeout Naon anu kudu dipigawé

Baidu lancah crawls na diagnoses informasi abnormal: Naon anu kudu dipigawé lamun stop kontak dibaca atawa ditulis?

Anggap yén ramatloka anjeun teu acan saestuna ku Baidu, Anjeun mimitina kudu ngalakukeun diagnosis lancah Crawling dina platform sumberdaya pilarian Baidu.

Naon anu kudu dipigawé lamun crawler Baidu gagal ngorondang link diagnostik?

Lamun Mapay Baidu gagal ngorondang jeung nangtukeun jenis panyakitna sababaraha kali, firewall nu mungkin geus diblokir Mapay teh.

Baidu Search Resource Platform > Diagnosis Crawl > Crawl Inpormasi Abnormal: kasalahan maca / nulis stop kontak ▼

Baidu Spider Crawl Gagal Diagnosis Abnormal Émbaran Socket Baca jeung Tulis Kasalahan Connection Timeout Naon anu kudu dipigawé

  • Utamana nalika nganggo Cloudflare CDN, anu diblokir sacara standar.
  • Dina Internét, aya omongan pikeun nambahkeun alamat IP xxx.xxx.xxx.xxx/24
  • Sanajan kitu, diusahakeun euweuh avail.

Abdi henteu ngahalangan lancah Baidu dina server, janten masalahna nyaéta WAF Cloudflare!

Asup ka Cloudflare → Kaamanan → WAF → Aturan firewall → Jieun Aturan firewall

  • Milarian aturan WAF anu aya hubunganana sareng crawler dina Cloudflare sareng mendakan pilihan "Robot Hukum Crawler" ▼

Baidu crawler Sitemap gagal ngorondang, sambungan tamat?ka-2

    • Sanggeus nyieun aturan firewall, antosan 10 menit, lajeng grab diagnosis, sarta sakabéh éta hasil nyekel!

Baidu crawler Sitemap gagal ngorondang, sambungan tamat?

Upami alamat file sitemap dikintunkeun dina platform sumber daya milarian Baidu, bakal aya masalah gagalna ngorondang sareng waktosna sambungan ▼

Baidu spider Crawling diagnosis gagalna stop kontak informasi abnormal maca jeung nulis kasalahan sambungan gambar timeout 3

Mapay Baidu gagal ngorondang solusi peta Sitemap

Asup ka Cloudflare → Kaamanan → WAF → Aturan Firewall → Jieun Aturan Firewall ▼

  1. médan, pilih Pamaké-Agén
  2. operator, pilih "ngandung"
  3. Tambahkeun agén pamaké anyar, klik "Atawa" dina tungtungna
  4. nilai, lebetkeun agén pamaké Baidu Spider UA di handap ieu masing-masing:
    • Baiduspider/2.0
    • Baiduspider-image
    • Baiduspider-render/2.0
    • http://www.baidu.com/search/spider.html
    • Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)
    • Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

    Saatos réngsé, uji sareng cokot deui, sareng hasilna mulangkeun header HTTP 200, nunjukkeun yén dipulut éta suksés▼

    • 抓取诊断 > 抓取详情
      以下是百度Spider抓取结果及页面信息:
    • 提交网址: https://www.etufo.org/sitemap_baidu.xml
    • 抓取网址: https://www.etufo.org/sitemap_baidu.xml
    • 抓取UA: Mozilla/5.0 (compatible; Baiduspider/2.0;
    • +http://www.baidu.com/search/spider.html)
    • 抓取时间: 2022-11-11 19:03:44
    • 网站IP: 172.***.***.149
    • 下载时长: 0.868秒
    • 返回HTTP头:HTTP/2 200

    agén pamaké spiders na crawlers séjén ogé bisa neangan sorangan dina cara nu sami.

    Blog Hope Chen Weiliang ( https://www.chenweiliang.com/ ) dibagikeun "Baidu lancah Crawling gagal pikeun ngadiagnosa abnormal informasi stop kontak maca jeung nulis kasalahan naon anu kudu dipigawé ngeunaan sambungan timeout", nu mantuan pikeun anjeun.

    Wilujeng ngabagikeun tautan artikel ieu:https://www.chenweiliang.com/cwl-29315.html

    Wilujeng sumping di saluran Telegram blog Chen Weiliang pikeun kéngingkeun apdet panganyarna!

    🔔 Janten anu pangheulana kéngingkeun "Panduan Penggunaan Alat AI Pemasaran Konten ChatGPT" dina diréktori luhur saluran! 🌟
    📚 Pituduh ieu ngandung nilai anu ageung, 🌟Ieu mangrupikeun kasempetan anu jarang, tong kantun! ⏰⌛💨
    Bagikeun sareng suka upami anjeun resep!
    Bagikeun sareng resep anjeun mangrupikeun motivasi kontinyu kami!

     

    koméntar

    Alamat email anjeun moal diterbitkeun. Widang anu diperyogikeun dianggo * Labél

    gulung ka luhur