Baidu स्पाइडर क्रॉलिंग विफलता निदान असामान्य जानकारी सॉकेट पढ़ें और लिखें त्रुटि कनेक्शन टाइमआउट क्या करना है

Baidu स्पाइडर डायग्नोस्टिक अपवाद जानकारी कैप्चर करता है: यदि सॉकेट गलत तरीके से पढ़ता है और लिखता है तो मुझे क्या करना चाहिए?

यह मानते हुए कि आपकी वेबसाइट Baidu द्वारा शामिल नहीं की गई है, आपको पहले Baidu खोज संसाधन प्लेटफ़ॉर्म पर स्पाइडर क्रॉलिंग डायग्नोसिस करना होगा।

यदि Baidu क्रॉलर डायग्नोस्टिक लिंक क्रॉल करने में विफल रहता है तो मुझे क्या करना चाहिए?

यदि Baidu क्रॉलर क्रॉल डायग्नोसिस कई बार विफल हो जाता है, तो हो सकता है कि फ़ायरवॉल ने क्रॉलर प्रोग्राम को ब्लॉक कर दिया हो।

Baidu खोज संसाधन प्लेटफ़ॉर्म > क्रॉल निदान > क्रॉल अपवाद जानकारी: सॉकेट पढ़ने और लिखने में त्रुटियां ▼

Baidu स्पाइडर क्रॉलिंग विफलता निदान अपवाद जानकारी सॉकेट पढ़ने और लिखने की त्रुटियां कनेक्शन टाइमआउट को हल करें

  • विशेष रूप से Cloudflare CDN का उपयोग करते समय, यह डिफ़ॉल्ट रूप से ब्लॉक हो जाता है।
  • इंटरनेट पर इसे आईपी एड्रेस जोड़ने के लिए कहा जाता है xxx.xxx.xxx.xxx/24
  • हालांकि कोशिश की, कोई फायदा नहीं हुआ।

मैंने Baidu स्पाइडर को सर्वर पर ब्लॉक नहीं किया, इसलिए समस्या Cloudflare के WAF की होनी चाहिए!

Cloudflare → Security → WAF → फ़ायरवॉल रूल्स → क्रिएट फ़ायरवॉल रूल में लॉग इन करें

  • Cloudflare पर क्रॉलर्स से संबंधित WAF नियम खोजें, और "वैध रोबोट क्रॉलर" का विकल्प मिला ▼

Baidu क्रॉलर साइटमैप क्रॉलिंग विफलता और कनेक्शन टाइमआउट में क्या गलत है?शीट 2

    • फ़ायरवॉल नियम बनाने के बाद, 10 मिनट तक प्रतीक्षा करें, और फिर निदान को पकड़ें, और उन सभी को सफलतापूर्वक पकड़ लिया गया!

Baidu क्रॉलर साइटमैप क्रॉलिंग विफलता और कनेक्शन टाइमआउट में क्या गलत है?

यदि आप Baidu खोज संसाधन प्लेटफ़ॉर्म पर साइटमैप फ़ाइल का पता सबमिट करते हैं, तो क्रॉलिंग विफलता और कनेक्शन टाइमआउट ▼ जैसी समस्याएं होंगी

Baidu स्पाइडर क्रॉलिंग विफलता निदान असामान्य सूचना सॉकेट पढ़ने और लिखने में त्रुटि कनेक्शन टाइमआउट क्या करना है

Baidu क्रॉलर द्वारा साइटमैप मैप प्राप्त करने में विफलता का समाधान

Cloudflare → Security → WAF → फ़ायरवॉल रूल्स → क्रिएट फ़ायरवॉल रूल्स ▼ में लॉग इन करें

  1. फ़ील्ड, "उपयोगकर्ता एजेंट" चुनें
  2. ऑपरेटर, शामिल है चुनें
  3. एक नया उपयोगकर्ता एजेंट जोड़ें, अंतिम "या" पर क्लिक करें
  4. मूल्य, क्रमशः निम्नलिखित Baidu स्पाइडर UA उपयोगकर्ता एजेंट दर्ज करें:
    • Baiduspider/2.0
    • Baiduspider-image
    • Baiduspider-render/2.0
    • http://www.baidu.com/search/spider.html
    • Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)
    • Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

    पूरा होने के बाद, फ़ेचिंग का फिर से परीक्षण करें, और परिणाम HTTP हेडर 200 लौटाता है, यह दर्शाता है कि फ़ेचिंग सफल है▼

    • 抓取诊断 > 抓取详情
      以下是百度Spider抓取结果及页面信息:
    • 提交网址: https://www.etufo.org/sitemap_baidu.xml
    • 抓取网址: https://www.etufo.org/sitemap_baidu.xml
    • 抓取UA: Mozilla/5.0 (compatible; Baiduspider/2.0;
    • +http://www.baidu.com/search/spider.html)
    • 抓取时间: 2022-11-11 19:03:44
    • 网站IP: 172.***.***.149
    • 下载时长: 0.868秒
    • 返回HTTP头:HTTP/2 200

    अन्य मकड़ियों और क्रॉलर के उपयोगकर्ता एजेंट भी उसी तरह स्वयं को खोज सकते हैं।

    होप चेन वेइलियांग ब्लॉग ( https://www.chenweiliang.com/ ) "Baidu स्पाइडर क्रॉल विफलता निदान असामान्य जानकारी क्या करें यदि सॉकेट पढ़ने और लिखने में त्रुटि कनेक्शन का समय समाप्त हो गया है" साझा किया, जो आपके लिए उपयोगी है।

    इस लेख का लिंक साझा करने के लिए आपका स्वागत है:https://www.chenweiliang.com/cwl-29315.html

    अधिक छिपी हुई ट्रिक्स को अनलॉक करने के लिए, हमारे टेलीग्राम चैनल से जुड़ने के लिए आपका स्वागत है!

    पसंद आये तो शेयर और लाइक करें! आपके शेयर और लाइक हमारी निरंतर प्रेरणा हैं!

     

    发表 评论

    आपकी ईमेल आईडी प्रकाशित नहीं की जाएगी। आवश्यक फ़ील्ड का उपयोग किया जाता है * लेबल

    ऊपर स्क्रॉल करें