Baidu Spider Crawl Failure Diagnosis Abnormal nga Impormasyon Socket Read and Write Error Connection Timeout Unsa ang Buhaton

Ang Baidu Spider nagkamang ug nag-diagnose sa abnormal nga impormasyon: Unsa ang akong buhaton kung ang socket gibasa o gisulat?

Sa paghuna-huna nga ang imong website wala ma-index sa Baidu, kinahanglan una nimo nga maghimo ug spider crawling diagnosis sa Baidu search resource platform.

Unsa ang akong buhaton kung ang Baidu crawler mapakyas sa pag-crawl sa diagnostic link?

Kung ang Baidu crawler mapakyas sa pag-crawl ug pag-diagnose sa makadaghang higayon, ang firewall mahimong nakababag sa crawler.

Baidu Search Resource Platform > Crawl Diagnosis > Crawl Abnormal nga Impormasyon: sayop sa pagbasa/pagsulat sa socket ▼

Pagsulbad sa Baidu spider crawling failure diagnosis exception information socket read and write errors connection timeout

  • Ilabi na kung gigamit ang Cloudflare CDN, nga gibabagan sa default.
  • Sa Internet, adunay mga pakigpulong sa pagdugang sa usa ka IP address xxx.xxx.xxx.xxx/24
  • Apan, misulay sa walay kapuslanan.

Wala nako gibabagan ang mga kaka sa Baidu sa server, busa ang problema kinahanglan nga WAF sa Cloudflare!

Sign in sa Cloudflare → Security → WAF → Firewall Rules → Create Firewall Rule

  • Gipangita ang mga lagda sa WAF nga may kalabotan sa crawler sa Cloudflare ug nakit-an ang kapilian nga "Legal nga Robot Crawler" ▼

Ang Baidu crawler Sitemap napakyas sa pag-crawl, nag-time out ang koneksyon?ika-2

    • Pagkahuman sa paghimo sa mga lagda sa firewall, paghulat sa 10 ka minuto, ug dayon kuhaa ang diagnosis, ug silang tanan malampuson nga nakuha!

Ang Baidu crawler Sitemap napakyas sa pag-crawl, na-time out ang koneksyon?

Kung ang adres sa file sa sitemap gisumite sa platform sa kapanguhaan sa pagpangita sa Baidu, adunay mga problema sa kapakyasan sa pag-crawl ug oras sa koneksyon ▼

Baidu spider crawling failure diagnosis abnormal information socket read and write error connection timeout picture 3

Ang Baidu crawler napakyas sa pag-crawl sa solusyon sa mapa sa Sitemap

Sign in sa Cloudflare → Security → WAF → Firewall Rules → Create Firewall Rules ▼

  1. field, pilia ang User-Agent
  2. operator, pilia ang "naglangkob"
  3. Pagdugang bag-ong ahente sa tiggamit, i-klik ang "O" sa katapusan
  4. bili, isulod ang mosunod nga Baidu Spider UA user agent matag usa:
    • Baiduspider/2.0
    • Baiduspider-image
    • Baiduspider-render/2.0
    • http://www.baidu.com/search/spider.html
    • Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)
    • Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

    Human makompleto, sulayi ug kuhaa pag-usab, ug ang resulta mobalik sa HTTP header 200, nga nagpakita nga ang pagkuha malampuson▼

    • 抓取诊断 > 抓取详情
      以下是百度Spider抓取结果及页面信息:
    • 提交网址: https://www.etufo.org/sitemap_baidu.xml
    • 抓取网址: https://www.etufo.org/sitemap_baidu.xml
    • 抓取UA: Mozilla/5.0 (compatible; Baiduspider/2.0;
    • +http://www.baidu.com/search/spider.html)
    • 抓取时间: 2022-11-11 19:03:44
    • 网站IP: 172.***.***.149
    • 下载时长: 0.868秒
    • 返回HTTP头:HTTP/2 200

    Ang mga ahente sa tiggamit sa ubang mga kaka ug mga crawler mahimo usab nga mangita sa ilang kaugalingon sa parehas nga paagi.

    发表 评论

    Ang imong email address dili mamantala. Gigamit ang mga kinahanglanon nga uma * Label

    Linukot nga basahon sa Taas