Baidu スパイダー クロール障害診断 異常な情報 ソケットの読み取りと書き込みエラー 接続タイムアウトの対処法

Baidu Spider は異常な情報をクロールして診断します: ソケットが読み書きされている場合はどうすればよいですか?

あなたの Web サイトが Baidu に含まれていないと仮定すると、まず、Baidu 検索リソース プラットフォームでスパイダー クロールの診断を実行する必要があります。

Baidu クローラーが診断リンクのクロールに失敗した場合はどうすればよいですか?

Baidu クローラーが何度もクロールと診断に失敗する場合は、ファイアウォールがクローラーをブロックしている可能性があります。

Baidu 検索リソース プラットフォーム > クロール診断 > クロール異常情報: ソケット読み書きエラー ▼

Baidu スパイダー クロール障害診断 異常な情報 ソケットの読み取りと書き込みエラー 接続タイムアウトの対処法

  • 特に、デフォルトでブロックされている Cloudflare CDN を使用している場合。
  • インターネット上では、IPアドレスを追加するという話があります xxx.xxx.xxx.xxx/24
  • しかし、無駄にしようとしました。

サーバーで Baidu スパイダーをブロックしていないので、問題は Cloudflare の WAF にあるはずです。

Cloudflareにサインイン → セキュリティ → WAF → ファイアウォール ルール → ファイアウォール ルールの作成

  • Cloudflareでクローラー関連のWAFルールを探していたら「Legal Robot Crawler」という選択肢が見つかりました▼

Baidu クローラー サイトマップのクロールに失敗しました。接続がタイムアウトしましたか?2位

    • ファイアウォール ルールを作成した後、10 分待ってから診断を取得すると、すべて正常に取得されます。

Baidu クローラー サイトマップのクロールに失敗しました。接続がタイムアウトしましたか?

百度の検索リソースプラットフォームでサイトマップファイルのアドレスを送信すると、クローリングの失敗や接続タイムアウトの問題が発生 ▼

Baidu スパイダー クロール障害診断異常情報ソケット読み取りおよび書き込みエラー接続タイムアウト画像 3

バイドゥ クローラーがサイトマップ マップ ソリューションをクロールできませんでした

Cloudflareにサインイン → セキュリティ → WAF → ファイアウォールルール → ファイアウォールルールの作成 ▼

  1. フィールドで、ユーザーエージェントを選択します
  2. 演算子、「含む」を選択
  3. 新しいユーザー エージェントを追加し、最後に [または] をクリックします。
  4. 次の Baidu Spider UA ユーザー エージェントをそれぞれ入力します。
    • Baiduspider/2.0
    • Baiduspider-image
    • Baiduspider-render/2.0
    • http://www.baidu.com/search/spider.html
    • Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)
    • Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

    完了後、再度テストしてフェッチすると、結果は HTTP ヘッダー 200 を返し、フェッチが成功したことを示します▼

    • 抓取诊断 > 抓取详情
      以下是百度Spider抓取结果及页面信息:
    • 提交网址: https://www.etufo.org/sitemap_baidu.xml
    • 抓取网址: https://www.etufo.org/sitemap_baidu.xml
    • 抓取UA: Mozilla/5.0 (compatible; Baiduspider/2.0;
    • +http://www.baidu.com/search/spider.html)
    • 抓取时间: 2022-11-11 19:03:44
    • 网站IP: 172.***.***.149
    • 下载时长: 0.868秒
    • 返回HTTP头:HTTP/2 200

    他のスパイダーやクローラーのユーザーエージェントも同様に自分自身を検索できます。

    Hope Chen Weiliang ブログ ( https://www.chenweiliang.com/ ) 共有された「Baidu スパイダー クロールで、異常な情報ソケットの読み取りおよび書き込みエラーを診断できませんでした。接続タイムアウトの対処法」が役立ちます。

    この記事のリンクを共有することを歓迎します。https://www.chenweiliang.com/cwl-29315.html

    Chen WeiliangのブログのTelegramチャンネルへようこそ。最新のアップデートを入手できます!

    🔔 貴重な「ChatGPT コンテンツ マーケティング AI ツール使用ガイド」をチャンネル トップ ディレクトリでいち早く入手してください! 🌟
    📚 このガイドには非常に価値のある内容が含まれています。🌟これはめったにない機会です、お見逃しなく! ⏰⌛💨
    気に入ったらシェア&いいね!
    あなたの共有といいねは、私たちの継続的な動機です!

     

    发表评论

    あなたのメールアドレスが公開されることはありません。 必須アイテム * 标注

    トップにスクロールします