Baidu araneo rampanta malsukceso diagnozo nenormala informa ingo legi kaj skribi eraro konekto tempoeksperto kion fari

Baidu Spider rampas kaj diagnozas nenormalajn informojn: Kion mi faru se la ingo estas legita aŭ skribita?

Supozante, ke via retejo ne estis indeksita de Baidu, vi unue devas fari aranean rampan diagnozon sur la Baidu-serĉa rimeda platformo.

Kion mi faru se la rampilo Baidu malsukcesas rampi la diagnozan ligilon?

Se la rampilo de Baidu malsukcesas plurfoje rampi kaj diagnozi, la fajroŝirmilo eble blokis la rampilon.

Baidu Serĉa Rimeda Platformo > Rampa Diagnozo > Rampa Nenormala Informo: eraro de legado/skriba de socket ▼

Solvu Baidu araneo rampanta malsukceso diagnozo escepto informo ingo legi kaj skribi eraroj konekto tempo de tempo

  • Precipe kiam vi uzas Cloudflare CDN, kiu estas blokita defaŭlte.
  • En Interreto oni parolas pri aldoni IP-adreson xxx.xxx.xxx.xxx/24
  • Tamen, provis senrezulte.

Mi ne blokas Baidu-araneojn sur la servilo, do la problemo estu la WAF de Cloudflare!

Ensalutu al Cloudflare → Sekureco → WAF → Fajromuraj Reguloj → Krei Fajrmuro-Regulon

  • Serĉante WAF-regulojn pri crawler-rilataj sur Cloudflare kaj trovis la opcion "Leĝa Roboto-Crawler" ▼

登录Cloudflare → 安全性 → WAF → 防火墙规则 → 创建防火墙规则在Cloudflare上查找与爬虫相关的WAF规则,发现了“合法机器人爬虫”选项

    • Post krei la regulojn de fajroŝirmilo, atendu 10 minutojn, kaj poste prenu la diagnozon, kaj ĉiuj ili estas sukcese kaptitaj!

Rampilo de Baidu Retemapo malsukcesis rampi, konekto elĉerpita?

Se la dosier-adreso de la retmapo estas sendita sur la platformo de serĉo de Baidu, estos problemoj pri malsukceso de rampado kaj tempo de konekto ▼

Rampilo de Baidu Retemapo malsukcesis rampi, konekto elĉerpita?

La rampilo de Baidu malsukcesis rampi la solvon de la mapo-mapo

Ensalutu al Cloudflare → Sekureco → WAF → Fajromuraj Reguloj → Krei Fajrmuro-Regulojn ▼

百度蜘蛛抓取失败诊断异常信息socket读写错误连接超时怎么办 - 陈沩亮博客_网络营销策划_跨境电商运营网站推广教程

  1. kampo, elektu Uzanto-Agente
  2. operatoro, elektu "enhavas"
  3. Aldonu novan uzantan agenton, alklaku "Aŭ" ĉe la fino
  4. valoro, enigu la sekvan uzantan agenton de Baidu Spider UA respektive:
    • Baiduspider/2.0
    • Baiduspider-image
    • Baiduspider-render/2.0
    • http://www.baidu.com/search/spider.html
    • Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)
    • Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

    Post kompletigo, provu kaj alportu denove, kaj la rezulto resendas HTTP-kapon 200, indikante, ke la serĉado estas sukcesa▼

    • 抓取诊断 > 抓取详情
      以下是百度Spider抓取结果及页面信息:
    • 提交网址: https://www.etufo.org/sitemap_baidu.xml
    • 抓取网址: https://www.etufo.org/sitemap_baidu.xml
    • 抓取UA: Mozilla/5.0 (compatible; Baiduspider/2.0;
    • +http://www.baidu.com/search/spider.html)
    • 抓取时间: 2022-11-11 19:03:44
    • 网站IP: 172.***.***.149
    • 下载时长: 0.868秒
    • 返回HTTP头:HTTP/2 200

    Uzantaj agentoj de aliaj araneoj kaj crawlers ankaŭ povas serĉi sin en la sama maniero.

    Lasu komenton

    Via retadreso ne estos publikigita. Bezonataj kampoj estas uzataj * Etikedo

    Rulumu al Supro