Katalog artykułów
Baidu Spider indeksuje i diagnozuje nieprawidłowe informacje: Co powinienem zrobić, jeśli gniazdo jest odczytywane lub zapisywane?
Zakładając, że Twoja witryna nie została zindeksowana przez Baidu, musisz najpierw przeprowadzić diagnostykę indeksowania pająków na platformie zasobów wyszukiwania Baidu.
Co powinienem zrobić, jeśli robot Baidu nie może przeszukać łączy diagnostycznych?
Jeśli diagnoza indeksowania przeszukiwacza Baidu kilka razy nie powiedzie się, zapora mogła zablokować program przeszukiwacza.
Baidu Search Resource Platform > Diagnoza indeksowania > Informacje o wyjątku indeksowania: błąd odczytu/zapisu gniazda ▼
- Zwłaszcza przy korzystaniu z Cloudflare CDN, który jest domyślnie blokowany.
- W Internecie mówi się o dodaniu adresu IP
xxx.xxx.xxx.xxx/24
- Jednak próbowano bezskutecznie.
Nie zablokowałem pająków Baidu na serwerze, więc problemem powinien być WAF Cloudflare!
Zaloguj się do Cloudflare → Bezpieczeństwo → WAF → Reguły zapory → Utwórz regułę zapory
- Szukając reguł WAF związanych z robotem indeksującym w Cloudflare, znalazłem opcję „Legal Robot Crawler” ▼
- Po utworzeniu reguł zapory odczekaj 10 minut, a następnie pobierz diagnozę, a wszystkie zostaną pomyślnie przechwycone!
Co jest nie tak z błędem indeksowania mapy witryny i przekroczeniem limitu czasu połączenia dla robota indeksującego Baidu?
Jeśli prześlesz adres pliku mapy witryny na platformie zasobów wyszukiwania Baidu, wystąpią problemy, takie jak błąd indeksowania i przekroczenie limitu czasu połączenia ▼
Robotowi Baidu nie udało się zaindeksować rozwiązania mapy witryny
Zaloguj się do Cloudflare → Bezpieczeństwo → WAF → Reguły zapory → Utwórz reguły zapory ▼
- wybierz User-Agent
- operator, wybierz „zawiera”
- Dodaj nowego klienta użytkownika, kliknij „Lub” na końcu
- wprowadź odpowiednio następującego klienta użytkownika Baidu Spider UA:
-
Baiduspider/2.0
-
Baiduspider-image
-
Baiduspider-render/2.0
-
http://www.baidu.com/search/spider.html
-
Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)
-
Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)
Po zakończeniu przetestuj i pobierz ponownie, a wynik zwraca nagłówek HTTP 200, wskazujący, że pobieranie się powiodło▼
-
抓取诊断 > 抓取详情
以下是百度Spider抓取结果及页面信息:
-
提交网址: https://www.etufo.org/sitemap_baidu.xml
-
抓取网址: https://www.etufo.org/sitemap_baidu.xml
-
抓取UA: Mozilla/5.0 (compatible; Baiduspider/2.0;
-
+http://www.baidu.com/search/spider.html)
-
抓取时间: 2022-11-11 19:03:44
-
网站IP: 172.***.***.149
-
下载时长: 0.868秒
-
返回HTTP头:HTTP/2 200
Aplikacje klienckie innych pająków i robotów indeksujących mogą również wyszukiwać siebie w ten sam sposób.
Nadzieja Chen Weiliang Blog ( https://www.chenweiliang.com/ ) udostępnił „Diagnoza awarii indeksowania Baidu Spider Nieprawidłowe informacje, co zrobić, jeśli upłynął limit czasu połączenia błędu odczytu i zapisu gniazda”, który jest dla Ciebie pomocny.
Zapraszamy do udostępnienia linku do tego artykułu:https://www.chenweiliang.com/cwl-29315.html
Witamy na kanale Telegram bloga Chen Weiliang, aby uzyskać najnowsze aktualizacje!
📚 Ten przewodnik zawiera ogromną wartość, 🌟To rzadka okazja, nie przegap jej! ⏰⌛💨
Udostępnij i polub, jeśli chcesz!
Twoje udostępnianie i polubienia to nasza ciągła motywacja!