Baidu Spann krabbelen Echec Diagnos anormal Informatioun Socket Liesen a Schreiwen Feeler Verbindung Timeout wat ze maachen

Baidu Spider krabbelt an diagnostizéiert anormal Informatioun: Wat soll ech maachen wann de Socket gelies oder geschriwwe gëtt?

Unzehuelen datt Är Websäit net vu Baidu indexéiert gouf, musst Dir fir d'éischt eng Spider Crawling Diagnos op der Baidu Sichressource Plattform ausféieren.

Wat soll ech maachen wann de Baidu Crawler den diagnostesche Link net krabbelt?

Wann de Baidu Crawler e puer Mol net krabbelt an diagnostizéiert, kann d'Firewall de Crawler blockéiert hunn.

Baidu Sich Ressource Plattform > Crawl Diagnos > Crawl Abnormal Informatioun: Socket Lies- / Schreiffehler ▼

Baidu Spann krabbelen Echec Diagnos anormal Informatioun Socket Liesen a Schreiwen Feeler Verbindung Timeout wat ze maachen

  • Besonnesch wann Dir Cloudflare CDN benotzt, wat als Standard blockéiert ass.
  • Um Internet gëtt geschwat, eng IP Adress derbäi ze ginn xxx.xxx.xxx.xxx/24
  • Allerdéngs probéiert ouni Erfolleg.

Ech blockéieren net Baidu Spannen um Server, also sollt de Problem dem Cloudflare säi WAF sinn!

Mellt Iech un Cloudflare → Sécherheet → WAF → Firewall Regelen → Firewall Regel erstellen

  • Sich no Crawler-relatéierten WAF Reegelen op Cloudflare an hunn d'Optioun "Legal Robot Crawler" fonnt ▼

Baidu Crawler Sitemap konnt net krauchen, d'Verbindung ass ausgeschalt?2e

    • Nodeems Dir d'Firewall-Regelen erstallt hutt, waart 10 Minutten, a gräift dann d'Diagnos, an all si sinn erfollegräich gegraff!

Baidu Crawler Sitemap konnt net krauchen, d'Verbindung ass ausgeschalt?

Wann d'Sitemap-Dateiadress op der Baidu Sichressourceplattform ofgeliwwert gëtt, ginn et Probleemer vum Crawl-Feeler a Verbindungs-Timeout ▼

Baidu Spann krabbelen Echec Diagnos anormal Informatioun Socket Liesen a Schreiffehler Verbindung Timeout Bild 3

Baidu Crawler huet d'Sitemap Kaart Léisung net gekrabbelt

Umellen op Cloudflare → Sécherheet → WAF → Firewall Regelen → Firewall Regelen erstellen ▼

  1. Feld, wielt Benotzer-Agent
  2. Bedreiwer, wielt "enthält"
  3. Füügt neie Benotzer Agent, klickt "Oder" um Enn
  4. Wäert, gitt de folgende Baidu Spider UA Benotzer Agent respektiv:
    • Baiduspider/2.0
    • Baiduspider-image
    • Baiduspider-render/2.0
    • http://www.baidu.com/search/spider.html
    • Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)
    • Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

    Nom Fäerdegstellung, testt an erëm erofzelueden, an d'Resultat gëtt HTTP-Header 200 zréck, wat beweist datt d'Erfaassung erfollegräich ass▼

    • 抓取诊断 > 抓取详情
      以下是百度Spider抓取结果及页面信息:
    • 提交网址: https://www.etufo.org/sitemap_baidu.xml
    • 抓取网址: https://www.etufo.org/sitemap_baidu.xml
    • 抓取UA: Mozilla/5.0 (compatible; Baiduspider/2.0;
    • +http://www.baidu.com/search/spider.html)
    • 抓取时间: 2022-11-11 19:03:44
    • 网站IP: 172.***.***.149
    • 下载时长: 0.868秒
    • 返回HTTP头:HTTP/2 200

    Benotzer Agenten vun anere Spannen a Crawler kënnen och fir sech selwer an déi selwecht Manéier sichen.

    Hope Chen Weiliang Blog ( https://www.chenweiliang.com/ ) gedeelt "Baidu Spann krabbelt Versoen fir anormal Informatiounssocket ze diagnostizéieren Lies- a Schreiffehler wat Dir maache musst iwwer d'Verbindungstimeout", wat Iech hëllefräich ass.

    Wëllkomm de Link vun dësem Artikel ze deelen:https://www.chenweiliang.com/cwl-29315.html

    Wëllkomm op dem Telegram Kanal vum Chen Weiliang säi Blog fir déi lescht Updates ze kréien!

    🔔 Gitt deen Éischten dee wäertvollen "ChatGPT Content Marketing AI Tool Usage Guide" am Kanal Top Verzeechnes ze kréien! 🌟
    📚 Dëse Guide enthält en enorme Wäert, 🌟 Dëst ass eng selten Geleeënheet, verpasst et net! ⏰⌛💨
    Deelen a liken wann dir wëllt!
    Är Deelen a Likes sinn eis kontinuéierlech Motivatioun!

     

    Comments

    Är E-Mail Adress gëtt net verëffentlecht. Néideg Felder gi benotzt * Etikett

    scroll no uewen