បញ្ជីអត្ថបទ
Baidu Spider វារនិងវិភាគព័ត៌មានមិនប្រក្រតី៖ តើខ្ញុំគួរធ្វើដូចម្តេចប្រសិនបើរន្ធត្រូវបានអានឬសរសេរ?
ដោយសន្មត់ថាគេហទំព័ររបស់អ្នកមិនត្រូវបានធ្វើលិបិក្រមដោយ Baidu ទេ ដំបូងអ្នកត្រូវតែធ្វើការវិនិច្ឆ័យរោគពីងពាងនៅលើវេទិកាធនធានស្វែងរក Baidu ។
តើខ្ញុំគួរធ្វើដូចម្តេចប្រសិនបើឧបករណ៍ចាប់សញ្ញា Baidu បរាជ័យក្នុងការរុករកតំណភ្ជាប់រោគវិនិច្ឆ័យ?
ប្រសិនបើ Baidu crawler បរាជ័យក្នុងការវារ និងធ្វើរោគវិនិច្ឆ័យច្រើនដង នោះ Firewall ប្រហែលជាបានរារាំង crawler ហើយ។
Baidu Search Resource Platform > Crawl Diagnosis > Crawl Abnormal Information: កំហុសក្នុងការអាន/សរសេររន្ធ ▼

- ជាពិសេសនៅពេលប្រើ Cloudflare CDN ដែលត្រូវបានរារាំងតាមលំនាំដើម។
- នៅលើអ៊ីនធឺណិតមានការពិភាក្សាអំពីការបន្ថែមអាសយដ្ឋាន IP
xxx.xxx.xxx.xxx/24 - ទោះជាយ៉ាងណាព្យាយាមមិនបានផល។
ខ្ញុំមិនរារាំង Baidu ពីងពាងនៅលើម៉ាស៊ីនមេទេ ដូច្នេះបញ្ហាគួរតែជា WAF របស់ Cloudflare!
ចូល Cloudflare → Security → WAF → Firewall Rules → Create Firewall Rule
- កំពុងរកមើលច្បាប់ WAF ទាក់ទងនឹង crawler នៅលើ Cloudflare ហើយបានរកឃើញជម្រើស "Legal Robot Crawler" ▼

- បន្ទាប់ពីបង្កើតច្បាប់ជញ្ជាំងភ្លើង សូមរង់ចាំ 10 នាទី ហើយបន្ទាប់មកចាប់យកការវិនិច្ឆ័យ ហើយពួកគេទាំងអស់ត្រូវបានចាប់យកដោយជោគជ័យ!
Baidu crawler Sitemap បរាជ័យក្នុងការរុករក ការតភ្ជាប់អស់ពេលមែនទេ?
ប្រសិនបើអាសយដ្ឋានឯកសារផែនទីគេហទំព័រត្រូវបានដាក់ជូននៅលើវេទិកាធនធានស្វែងរក Baidu នោះនឹងមានបញ្ហានៃការបរាជ័យក្នុងការរុករក និងការអស់ពេលនៃការតភ្ជាប់ ▼

Baidu crawler បានបរាជ័យក្នុងការរុករកដំណោះស្រាយផែនទីគេហទំព័រ
ចូល Cloudflare → Security → WAF → Firewall Rules → Create Firewall Rules ▼

- វាល ជ្រើសរើស User-Agent
- ប្រតិបត្តិករ, ជ្រើសរើស "មាន"
- បន្ថែមភ្នាក់ងារអ្នកប្រើប្រាស់ថ្មី ចុច "ឬ" នៅចុងបញ្ចប់
- តម្លៃ សូមបញ្ចូលភ្នាក់ងារអ្នកប្រើប្រាស់ Baidu Spider UA ខាងក្រោមរៀងៗខ្លួន៖
-
Baiduspider/2.0 -
Baiduspider-image -
Baiduspider-render/2.0 -
http://www.baidu.com/search/spider.html -
Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html) -
Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)
បន្ទាប់ពីបញ្ចប់ សាកល្បង និងទៅយកម្តងទៀត ហើយលទ្ធផលត្រឡប់ HTTP header 200 ដោយបង្ហាញថាការទៅយកបានជោគជ័យ▼
-
抓取诊断 > 抓取详情以下是百度Spider抓取结果及页面信息: -
提交网址: https://www.etufo.org/sitemap_baidu.xml -
抓取网址: https://www.etufo.org/sitemap_baidu.xml -
抓取UA: Mozilla/5.0 (compatible; Baiduspider/2.0; -
+http://www.baidu.com/search/spider.html) -
抓取时间: 2022-11-11 19:03:44 -
网站IP: 172.***.***.149 -
下载时长: 0.868秒 -
返回HTTP头:HTTP/2 200
ភ្នាក់ងារអ្នកប្រើប្រាស់នៃសត្វពីងពាង និងអ្នករុករកផ្សេងទៀតក៏អាចស្វែងរកខ្លួនឯងតាមរបៀបដូចគ្នាដែរ។
Hope Chen Weiliang Blog ( https://www.chenweiliang.com/ ) បានចែករំលែកថា "Baidu spider crawling fail to diagnose abnormal information socket read and write errors what to do about connection timeout" ដែលមានប្រយោជន៍សម្រាប់អ្នក។
សូមស្វាគមន៍ចំពោះការចែករំលែកតំណភ្ជាប់នៃអត្ថបទនេះ៖https://www.chenweiliang.com/cwl-29315.html
ដើម្បីដោះសោល្បិចលាក់កំបាំងបន្ថែមទៀត🔑 សូមស្វាគមន៍មកកាន់ឆានែល Telegram របស់យើង!
Share និង Like បើចូលចិត្ត! ការចែករំលែក និងការចូលចិត្តរបស់អ្នកគឺជាការលើកទឹកចិត្តបន្តរបស់យើង!