Baidu स्पायडर क्रॉलिंग अपयश निदान असामान्य माहिती सॉकेट वाचणे आणि लिहिणे त्रुटी कनेक्शन कालबाह्य काय करावे

Baidu Spider निदान अपवाद माहिती कॅप्चर करते: सॉकेट चुकीचे वाचत आणि लिहित असल्यास मी काय करावे?

तुमची वेबसाइट Baidu द्वारे समाविष्ट केलेली नाही असे गृहीत धरून, तुम्ही प्रथम Baidu शोध संसाधन प्लॅटफॉर्मवर स्पायडर क्रॉलिंग निदान करणे आवश्यक आहे.

Baidu क्रॉलर डायग्नोस्टिक लिंक क्रॉल करण्यात अयशस्वी झाल्यास मी काय करावे?

Baidu क्रॉलर क्रॉल निदान अनेक वेळा अयशस्वी झाल्यास, फायरवॉलने क्रॉलर प्रोग्राम अवरोधित केला असेल.

Baidu शोध संसाधन प्लॅटफॉर्म > क्रॉल निदान > क्रॉल अपवाद माहिती: सॉकेट वाचन आणि लेखन त्रुटी ▼

Baidu स्पायडर क्रॉलिंग अपयश निदान असामान्य माहिती सॉकेट वाचणे आणि लिहिणे त्रुटी कनेक्शन कालबाह्य काय करावे

  • विशेषत: Cloudflare CDN वापरताना, ते डीफॉल्टनुसार अवरोधित केले जाते.
  • इंटरनेटवर, आयपी अॅड्रेस जोडण्यास सांगितले जाते xxx.xxx.xxx.xxx/24
  • मात्र, तसा प्रयत्न करूनही उपयोग झाला नाही.

मी Baidu स्पायडरना सर्व्हरवर ब्लॉक केले नाही, त्यामुळे समस्या Cloudflare च्या WAF ची असावी!

Cloudflare → सुरक्षा → WAF → फायरवॉल नियम → फायरवॉल नियम तयार करा वर लॉगिन करा

  • Cloudflare वर क्रॉलर्सशी संबंधित WAF नियम शोधा आणि "कायदेशीर रोबोट क्रॉलर" चा पर्याय सापडला ▼

Baidu क्रॉलर साइटमॅप क्रॉलिंग अयशस्वी आणि कनेक्शन कालबाह्य यात काय चूक आहे?2रा

    • फायरवॉल नियम तयार केल्यानंतर, 10 मिनिटे प्रतीक्षा करा, आणि नंतर निदान पकडा आणि ते सर्व यशस्वीरित्या कॅप्चर केले गेले!

Baidu क्रॉलर साइटमॅप क्रॉलिंग अयशस्वी आणि कनेक्शन टाइमआउटमध्ये काय चूक आहे?

तुम्ही Baidu शोध संसाधन प्लॅटफॉर्मवर साइटमॅप फाइलचा पत्ता सबमिट केल्यास, क्रॉलिंग अयशस्वी आणि कनेक्शन कालबाह्य यासारख्या समस्या असतील ▼

Baidu स्पायडर क्रॉलिंग अपयश निदान असामान्य माहिती सॉकेट वाचणे आणि लिहिणे त्रुटी कनेक्शन कालबाह्य काय करावे

साइटमॅप नकाशा हस्तगत करण्यात Baidu क्रॉलरच्या अपयशाचे समाधान

Cloudflare → सुरक्षा → WAF → फायरवॉल नियम → फायरवॉल नियम तयार करा ▼ वर लॉग इन करा

  1. फील्ड, "वापरकर्ता एजंट" निवडा
  2. ऑपरेटर, समाविष्ट आहे निवडा
  3. नवीन वापरकर्ता एजंट जोडा, शेवटचे "किंवा" क्लिक करा
  4. मूल्य, अनुक्रमे खालील Baidu Spider UA वापरकर्ता एजंट प्रविष्ट करा:
    • Baiduspider/2.0
    • Baiduspider-image
    • Baiduspider-render/2.0
    • http://www.baidu.com/search/spider.html
    • Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)
    • Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

    पूर्ण झाल्यानंतर, फेचिंगची पुन्हा चाचणी करा आणि परिणाम HTTP शीर्षलेख 200 परत करेल, हे दर्शविते की आणणे यशस्वी झाले आहे▼

    • 抓取诊断 > 抓取详情
      以下是百度Spider抓取结果及页面信息:
    • 提交网址: https://www.etufo.org/sitemap_baidu.xml
    • 抓取网址: https://www.etufo.org/sitemap_baidu.xml
    • 抓取UA: Mozilla/5.0 (compatible; Baiduspider/2.0;
    • +http://www.baidu.com/search/spider.html)
    • 抓取时间: 2022-11-11 19:03:44
    • 网站IP: 172.***.***.149
    • 下载时长: 0.868秒
    • 返回HTTP头:HTTP/2 200

    इतर स्पायडर आणि क्रॉलर्सचे वापरकर्ता एजंट देखील त्याच प्रकारे स्वतःचा शोध घेऊ शकतात.

    होप चेन वेइलांग ब्लॉग ( https://www.chenweiliang.com/ ) ने शेअर केले "Baidu Spider Crawl Failure Dignosis असामान्य माहिती सॉकेट रीड आणि राईट एरर कनेक्शन कालबाह्य झाल्यास काय करावे", जे तुमच्यासाठी उपयुक्त आहे.

    या लेखाची लिंक सामायिक करण्यासाठी आपले स्वागत आहे:https://www.chenweiliang.com/cwl-29315.html

    नवीनतम अपडेट्स मिळवण्यासाठी चेन वेइलियांगच्या ब्लॉगच्या टेलिग्राम चॅनेलवर आपले स्वागत आहे!

    🔔 चॅनल टॉप डिरेक्टरीमध्ये मौल्यवान "ChatGPT Content Marketing AI टूल वापर मार्गदर्शक" मिळवणारे पहिले व्हा! 🌟
    📚 या मार्गदर्शकामध्ये प्रचंड मूल्य आहे, 🌟ही एक दुर्मिळ संधी आहे, ती चुकवू नका! ⏰⌛💨
    आवडल्यास शेअर आणि लाईक करा!
    तुमचे शेअरिंग आणि लाईक्स ही आमची सतत प्रेरणा आहे!

     

    评论 评论

    आपला ईमेल पत्ता प्रकाशित केला जाणार नाही. 用 项 已 用 * लेबल

    वर स्क्रोल करा