Baidu spider crawling failure diagnosis រន្ធ​ព័ត៌មាន​មិន​ប្រក្រតី អាន​និង​សរសេរ​កំហុស​ការ​តភ្ជាប់​អស់ពេល​អ្វីដែលត្រូវធ្វើ

Baidu Spider ​វារ​និង​វិភាគ​ព័ត៌មាន​មិន​ប្រក្រតី​៖ ​តើ​ខ្ញុំ​គួរ​ធ្វើ​ដូចម្តេច​ប្រសិនបើ​រន្ធ​ត្រូវបាន​អាន​ឬ​សរសេរ​?

ដោយសន្មត់ថាគេហទំព័ររបស់អ្នកមិនត្រូវបានធ្វើលិបិក្រមដោយ Baidu ទេ ដំបូងអ្នកត្រូវតែធ្វើការវិនិច្ឆ័យរោគពីងពាងនៅលើវេទិកាធនធានស្វែងរក Baidu ។

តើខ្ញុំគួរធ្វើដូចម្តេចប្រសិនបើឧបករណ៍ចាប់សញ្ញា Baidu បរាជ័យក្នុងការរុករកតំណភ្ជាប់រោគវិនិច្ឆ័យ?

ប្រសិនបើ Baidu crawler បរាជ័យក្នុងការវារ និងធ្វើរោគវិនិច្ឆ័យច្រើនដង នោះ Firewall ប្រហែលជាបានរារាំង crawler ហើយ។

Baidu Search Resource Platform > Crawl Diagnosis > Crawl Abnormal Information: កំហុសក្នុងការអាន/សរសេររន្ធ ▼

ដោះស្រាយការបរាជ័យក្នុងការរុករក Baidu Spider ការវិនិច្ឆ័យករណីលើកលែងរន្ធព័ត៌មាន អាន និងសរសេរកំហុសអស់ពេលនៃការតភ្ជាប់

  • ជាពិសេសនៅពេលប្រើ Cloudflare CDN ដែលត្រូវបានរារាំងតាមលំនាំដើម។
  • នៅលើអ៊ីនធឺណិតមានការពិភាក្សាអំពីការបន្ថែមអាសយដ្ឋាន IP xxx.xxx.xxx.xxx/24
  • ទោះ​ជា​យ៉ាង​ណា​ព្យាយាម​មិន​បាន​ផល។

ខ្ញុំមិនរារាំង Baidu ពីងពាងនៅលើម៉ាស៊ីនមេទេ ដូច្នេះបញ្ហាគួរតែជា WAF របស់ Cloudflare!

ចូល Cloudflare → Security → WAF → Firewall Rules → Create Firewall Rule

  • កំពុងរកមើលច្បាប់ WAF ទាក់ទងនឹង crawler នៅលើ Cloudflare ហើយបានរកឃើញជម្រើស "Legal Robot Crawler" ▼

Baidu crawler Sitemap បរាជ័យក្នុងការរុករក ការតភ្ជាប់អស់ពេលមែនទេ?ទី 2

    • បន្ទាប់ពីបង្កើតច្បាប់ជញ្ជាំងភ្លើង សូមរង់ចាំ 10 នាទី ហើយបន្ទាប់មកចាប់យកការវិនិច្ឆ័យ ហើយពួកគេទាំងអស់ត្រូវបានចាប់យកដោយជោគជ័យ!

Baidu crawler Sitemap បរាជ័យក្នុងការរុករក ការតភ្ជាប់អស់ពេលមែនទេ?

ប្រសិនបើអាសយដ្ឋានឯកសារផែនទីគេហទំព័រត្រូវបានដាក់ជូននៅលើវេទិកាធនធានស្វែងរក Baidu នោះនឹងមានបញ្ហានៃការបរាជ័យក្នុងការរុករក និងការអស់ពេលនៃការតភ្ជាប់ ▼

Baidu spider crawling failure diagnosis រន្ធព័ត៌មានមិនប្រក្រតី អាន និងសរសេរកំហុសក្នុងការតភ្ជាប់ អស់ពេលរូបភាព 3

Baidu crawler បានបរាជ័យក្នុងការរុករកដំណោះស្រាយផែនទីគេហទំព័រ

ចូល Cloudflare → Security → WAF → Firewall Rules → Create Firewall Rules ▼

  1. វាល ជ្រើសរើស User-Agent
  2. ប្រតិបត្តិករ, ជ្រើសរើស "មាន"
  3. បន្ថែមភ្នាក់ងារអ្នកប្រើប្រាស់ថ្មី ចុច "ឬ" នៅចុងបញ្ចប់
  4. តម្លៃ សូមបញ្ចូលភ្នាក់ងារអ្នកប្រើប្រាស់ Baidu Spider UA ខាងក្រោមរៀងៗខ្លួន៖
    • Baiduspider/2.0
    • Baiduspider-image
    • Baiduspider-render/2.0
    • http://www.baidu.com/search/spider.html
    • Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)
    • Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

    បន្ទាប់ពីបញ្ចប់ សាកល្បង និងទៅយកម្តងទៀត ហើយលទ្ធផលត្រឡប់ HTTP header 200 ដោយបង្ហាញថាការទៅយកបានជោគជ័យ▼

    • 抓取诊断 > 抓取详情
      以下是百度Spider抓取结果及页面信息:
    • 提交网址: https://www.etufo.org/sitemap_baidu.xml
    • 抓取网址: https://www.etufo.org/sitemap_baidu.xml
    • 抓取UA: Mozilla/5.0 (compatible; Baiduspider/2.0;
    • +http://www.baidu.com/search/spider.html)
    • 抓取时间: 2022-11-11 19:03:44
    • 网站IP: 172.***.***.149
    • 下载时长: 0.868秒
    • 返回HTTP头:HTTP/2 200

    ភ្នាក់ងារអ្នកប្រើប្រាស់នៃសត្វពីងពាង និងអ្នករុករកផ្សេងទៀតក៏អាចស្វែងរកខ្លួនឯងតាមរបៀបដូចគ្នាដែរ។

    Hope Chen Weiliang Blog ( https://www.chenweiliang.com/ ) បានចែករំលែកថា "Baidu spider crawling fail to diagnose abnormal information socket read and write errors what to do about connection timeout" ដែលមានប្រយោជន៍សម្រាប់អ្នក។

    សូមស្វាគមន៍ចំពោះការចែករំលែកតំណភ្ជាប់នៃអត្ថបទនេះ៖https://www.chenweiliang.com/cwl-29315.html

    ដើម្បីដោះសោល្បិចលាក់កំបាំងបន្ថែមទៀត🔑 សូមស្វាគមន៍មកកាន់ឆានែល Telegram របស់យើង!

    Share និង Like បើចូលចិត្ត! ការចែករំលែក និងការចូលចិត្តរបស់អ្នកគឺជាការលើកទឹកចិត្តបន្តរបស់យើង!

     

    发表评论។

    អាសយដ្ឋានអ៊ីមែលរបស់អ្នកនឹងមិនត្រូវបានផ្សព្វផ្សាយទេ។ 必填项已用។ * 标注។

    រមូរទៅកំពូល