Baidu spider crawling failure диагностика необичайна информация сокет четене и запис грешка изчакване на връзката какво да правя

Baidu Spider улавя информация за диагностични изключения: Какво трябва да направя, ако сокетът чете и пише неправилно?

Ако приемем, че вашият уебсайт не е включен от Baidu, първо трябва да извършите диагностика на обхождане на паяк в платформата за ресурси за търсене на Baidu.

Какво трябва да направя, ако роботът на Baidu не успее да обходи диагностичните връзки?

Ако диагностиката на обхождане на Baidu се провали няколко пъти, защитната стена може да е блокирала програмата за обхождане.

Платформа за ресурси за търсене на Baidu > Диагностика при обхождане > Информация за изключения при обхождане: Грешки при четене и запис на сокет ▼

Решете Baidu spider crawling error диагностика изключение информация сокет четене и запис грешки изчакване на връзката

  • Особено когато използвате Cloudflare CDN, той е блокиран по подразбиране.
  • В интернет се казва, че добавя IP адреса xxx.xxx.xxx.xxx/24
  • Въпреки това, опитах това без резултат.

Не блокирах паяците на Baidu на сървъра, така че проблемът трябва да е WAF на Cloudflare!

Влезте в Cloudflare → Сигурност → WAF → Правила за защитна стена → Създаване на правило за защитна стена

  • Намерете правилата на WAF, свързани с роботите в Cloudflare, и открихте опцията за „легитимен роботизиращ робот“ ▼

Влезте в Cloudflare → Сигурност → WAF → Правила за защитната стена → Създаване на правило за защитната стена. Търсейки WAF правила, свързани с уеб роботи в Cloudflare, открих опцията „Legitimate Web Crawler“.

    • След като създадете правилата на защитната стена, изчакайте 10 минути и след това вземете диагнозата и всички те бяха успешно заловени!

Какво не е наред с неуспешното обхождане на Sitemap на Baidu и времето за изчакване на връзката?

Ако изпратите адреса на файла Sitemap на платформата за ресурси за търсене на Baidu, ще има проблеми като неуспешно обхождане и изчакване на връзката ▼

Какво не е наред с неуспешното обхождане на Sitemap на Baidu и времето за изчакване на връзката?

Решение на неуспеха на робота на Baidu да грабне картата на Sitemap

Влезте в Cloudflare → Сигурност → WAF → Правила за защитна стена → Създаване на правила за защитна стена ▼

Грешка в диагностиката на неуспех при обхождане на Baidu Spider, грешка при четене/запис на сокет, време за изчакване на връзката: Какво да правя? - Блог на Чен Уейлианг_Планиране на мрежов маркетинг_Урок за промотиране на уебсайтове през граница

  1. поле, изберете „Потребителски агент“
  2. оператор, изберете Съдържа
  3. Добавете нов потребителски агент, щракнете върху последното „Или“
  4. Стойност, съответно въведете следния потребителски агент на Baidu Spider UA:
    • Baiduspider/2.0
    • Baiduspider-image
    • Baiduspider-render/2.0
    • http://www.baidu.com/search/spider.html
    • Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)
    • Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

    След завършване тествайте извличането отново и резултатът връща HTTP заглавка 200, което показва, че извличането е успешно▼

    • 抓取诊断 > 抓取详情
      以下是百度Spider抓取结果及页面信息:
    • 提交网址: https://www.etufo.org/sitemap_baidu.xml
    • 抓取网址: https://www.etufo.org/sitemap_baidu.xml
    • 抓取UA: Mozilla/5.0 (compatible; Baiduspider/2.0;
    • +http://www.baidu.com/search/spider.html)
    • 抓取时间: 2022-11-11 19:03:44
    • 网站IP: 172.***.***.149
    • 下载时长: 0.868秒
    • 返回HTTP头:HTTP/2 200

    Потребителските агенти на други паяци и роботи също могат да търсят себе си по същия начин.

    Блог на Hope Chen Weiliang ( https://www.chenweiliang.com/ ) сподели „Неуспешна диагностика при обхождане на Baidu Spider Необичайна информация Какво да направя, ако времето за изчакване на връзката при четене и запис на гнездото е изтекло“, което е полезно за вас.

    Добре дошли да споделите връзката към тази статия:https://www.chenweiliang.com/cwl-29315.html

    За да отключите още скрити трикове🔑, заповядайте в нашия Telegram канал!

    Споделете и харесайте, ако ви харесва! Вашите споделяния и харесвания са нашата постоянна мотивация!

     

    发表 评论

    Вашият имейл адрес няма да бъде публикуван. Използват се задължителните полета * Етикет

    Преминете към Top